米MS、「ワード」に文字起こし機能を追加 講義や電話に利用可能
ニューヨーク(CNN Business) 米マイクロソフトは27日までに、講義や電話の音声を書き起こすことができる機能の提供を開始した。同社の文書作成ソフト「ワード」のウェブ版で利用できる。
利用者は事前に用意した録音をアップロードするか、リアルタイムの会話をワード内に録音するかを選べる。複数の話者が発言した場合も検出が可能で、発言内容にタイムスタンプを付けて文字に起こしてくれる。
この機能は「トランスクライブ・イン・ワード」と呼ばれ、現時点ではワードのウェブ版でのみ利用可能。同社の定額課金サービス「マイクロソフト365」の契約者のみがアクセスできる。
文字起こしを素早く簡単にする目的で人工知能(AI)を使う試みは以前からあったが、近年は精度が向上。マイクロソフト以外にも、米新興企業オッターやアップル、グーグルなどがAIを駆使した書き起こしサービスを市場投入している。グーグルが昨年公開したアプリ「レコーダー」では、リアルタイムの会話を検索可能な文章に無料で書き起こしてくれるが、異なる話者を識別することはできない。
複数の話者が発言した場合も検出が可能となっている/Microsoft
トランスクライブ・イン・ワードの場合、書き起こした内容はワード文書の隣に表示されるため、タイピングによる文書作成はそのまま続けることができる。書き起こしの一部を引用したり、全体をメインの文章に追加したりすることも可能だ。
マイクロソフトはブログで、年内にモバイル版ワードにも文字起こしサービスを追加する予定だとし、英語以外の言語についても取り組んでいると説明。ウィンドウズやマックOSで使えるデスクトップ版アプリの投入時期については言及しなかった。