Twitter Safety Mode
Twitter

中傷や嫌がらせ対策へ取り組む Twitter が、有害なユーザーからのリプライを制限したり、自動でブロックやミュートしてくれる新機能「セーフティーモード」を開発していることが分かりました。

Twitter の投資家向けプレゼンテーションでは、サービスの健全化に向け、ユーザーが望まない関わりを未然に防ぐためのよりスマートなツールを模索してゆくとの説明があり、開発中とおぼしき新機能のスクリーンショットが添えられています。

そちらのスクリーンショットによると、セーフティーモードとは

・暴力的なリプライなど、ユーザーが望まない関わりを事前に防ぐための機能

・攻撃的だったりスパム行為を検出されたアカウントはセーフティーモードのユーザーと7日間関わることができなくなる。また、そうしたアカウントのリプライは表示されにくくなる。

・「自動ブロックとミュート」を有効にすると、Twitterルールを破っていると思われるアカウントは自動でブロックする。罵倒や攻撃的な言葉遣い、 ヘイト発言をするアカウントは自動でミュートされる。

・もし自分のツイートに中傷的あるいはスパムと思われるリプライがあった場合、ネガティブな反応があったと通知する

・検出されたアカウントはまとめて確認できる (その後、ミュート解除などができる)

といった機能です。

Twitter には脅迫や嫌がらせ、ヘイト行為等を禁じるルールが従来からあり、違反者は警告やアカウントの凍結といったペナルティを受けます。

しかしこの「セーフティーモード」は、ルール違反やボーダー的な行為を検出したとき、違反者への警告だけでなく、被害を受ける周囲のユーザーとのインタラクション機会を減らして被害を未然に防ぐこと、事後の報告頼りではなく、有害と見なされるアカウントへの対処を事前にユーザーに選択させ、自動的に適用することが特徴です。

当然、Twitter側の検出精度が高いことが前提になりますが、このあたりは地域や言語によって大きな差があります。またセーフティーモードの画面でも、検出されて自動対応したアカウントは「潜在的に攻撃的またはスパム行為の可能性がある」との表現で、望まない自動対応をしていないか確認できるようになっています。

自分のツイートへのネガティブなリプライを検出した際の通知は、人によってはこの通知が届くこと自体で消耗しそうな気もしますが、何も予期せず返信が来たなと読みに行って嫌がらせと分かるよりはマシかもしれません。

通知であるからには選択やオフにできるはずで、逆に積極的に確認して報告なりブロックなり反撃をしたい人には便利という考え方もあります。

この「セーフティーモード」が実際に正式な機能として提供されるのか、仕様が今後調整されるのか等はまだ不明。Twitterは常に新機能の模索を続けており、一部の一般ユーザー向けに実験的に提供したのち取り下げてしまう場合もあります。

Twitterルール