Research & Development 新聞社のR&D

文章校正AI Typoless

Typoless(タイポレス)は、朝日新聞社が2023年10月にリリースした文章校正AI。社内で使っている『用語と表現の手引』の校閲ルール10万個に加え、新聞原稿の校正履歴を学習させており、「てにをは」などの助詞や同音異義語の誤りを瞬時に見つけ出します。さらに、差別や固定観念の再生産につながりかねないような表現も指摘してくれます。

「てにをは」や同音異義語、差別表現も指摘

たとえば、こんな文章があったとしましょう。

Typoless(タイポレス)は、朝日新聞社が2023年10月にリリースした文章校正AI。社内で使っている『用語と表現の手引き』の校閲ルール10万個に加え、新聞現行の校正履歴を学習させており、「てにをは」などの助詞や同音異義語の謝りを瞬時に見つけ出します。さらに、差別や固定概念の再生産につながりかないような表現も指摘してくれます。

どこかで見た文章ですね。そう、直前の文章とほとんど同じです。ただ、おかしなところがいくつかあります。お気づきになりましたか? では、この文章をTypolessにかけてみましょう。枠内に文章を貼り付け、「校正」をクリック。すると……

AI校正の結果が赤字で示されました。「現行」→「原稿」、3文目の「ね」の抜け落ち、の2か所です。青字は、朝日新聞の校閲ルールに沿った修正候補です。「手引き」は「手引」としましょう、「『異議』は使い分けを迷う言葉ですが大丈夫ですか?」という念のための指摘、「謝り」→「誤り」に、という3点です。

記者はもちろん、教育・法務・広報など、正確な文章を求められる仕事は数多く、Typolessは多くの方に関心を持っていただいているといいます。エンジニアとして開発にあたった、メディア研究開発センターの倉井敬史さんに手ごたえを聞きました。

デモ版に反響

メディア研究開発センターは、自然言語処理や画像認識、電子データからの記事自動生成など、各種AIの研究開発に取り組んでいる朝日新聞社内の組織です。

校正AIの研究は10年来のプロジェクトで、2022年秋に朝日新聞Playgroundというサイトでデモ版を公開しました。この段階ではあくまで「お試し」だったのですが、SNSで反響があったり、翻訳関係の会社からお問い合わせをいただいたりして、「需要がありそうだ」という感触をつかむことができました。

ビジネス部門とも連携し、販売までの態勢をつくって取り組んでいこう、と本腰を入れたのが2023年春。ユーザーの操作性などの部分について「こんなふうにしたらいいのでは」と提案していたこともあって、自分がエンジニアチームのリーダーを任せられることになりました。

UIUXやデザインをどうするか。実際に動かすためのインフラは何を選ぶか。個人向け・法人向けの料金設定、課金システムはどれがベストか。一つひとつ手探りで考え、実装していきました。アプリの名前やロゴも決めて、10月、ようやく公開にこぎつけました。Typoは、タイプミスや誤植という意味です。

倉井 敬史(くらい・たかふみ) 大学院修了後、エンジニアとして2020年に入社。アンケート・クイズ作成ツールQuzilla、画像解析やAIを駆使して、複数の記事が掲載されている新聞紙面から個々の記事を取り出す技術の開発(特許取得)などに携わる。仕事に行き詰まったときはピアノやビオラを弾いて気分転換する。

良質な学習データ

10月下旬、日本最大級のIT展示会「Japan IT Week」に出展しました。3日間の展示会で、600人以上に興味を持っていただきました。社内のクリエイティブチームにもかかわってもらい、CMもつくりました。東京のタクシーで1週間限定の放映でしたが、「タクシーでCMを見た」という方もいました。しばらくお問い合わせが殺到、うれしい悲鳴でした。

「自ら書いた文章を校正する」という使い方以外にも、ニーズがありそうだということもわかりました。たとえば、コールセンターのような顧客対応窓口で「問い合わせ・苦情などの書き起こしを読みやすい文章にする」という用途や、日本語から外国語に機械翻訳するのにあたり、翻訳の精度を上げるためにもとの文章をより正確な日本語にしておく、などです。

会場では「朝日新聞社のプロダクトなんですね」という声も多くいただきました。「文章を扱っているプロならではの仕事だ」という信頼感と、「新聞社に正社員のエンジニアがいる」「AIを研究している部署があるばかりか、このような展開まで実現している」という意外性が両方込められたものでした。

自然言語処理を研究する者にとって、実は新聞社は魅力的な学習データの宝庫です。訓練を受けた記者が書いた、質の高い文章の蓄積があります。そのような他にない資産を生かし、AIをかけあわせてサービスを生み出すことができたのはよかったです。

自分自身、入社4年目でこのような仕事にかかわることができて非常にありがたいですし、もちろん大変なこともありますが、どちらかというとすごく楽しめています。

仕事の軸は「興味を広げるきっかけを」

大学院では、機械学習を使って人の1秒後の動きを予想する、という研究をしていました。就職にあたっては、人々に選択肢や興味を広げるきっかけとなるような機会を提供したい、そんな「出会いの場」を技術的につくりだしたい、と考えていました。

エンジニアにもいろいろな活躍のしかたがありますが、自分は一人ひとりのユーザーに降りていくようなものをつくりたいという気持ちがありました。Typolessは個人向けのサービスでもあるので、自分の根っこの考え方とはフィットしてるのかなと思います。

朝日新聞社にはいろいろな仕事があって、「職種のデパート」と言われたりします。入ってみると、人の性格もけっこうデパートというか、いい意味でとんでもない人がいます。そういう人間臭い部分が好きで、遊び心があるのがいいところです。

自主性も大事にしてもらえるので、入社1、2年目に自分がしたい研究開発に取り組めたことが、今の仕事に役立っています。Typolessがうまくいったら、その経験をもとに、他にも社内にある種を育てたい。でもまずは、Typolessを成長させることをがんばります。

PAGETOP