音声合成AITalk®の読み上げ精度のさらなる向上および医療分野向け辞書のリリースについて
エーアイでは今般、ニュース記事を正しく読み上げる調査を社内で実施致しました。調査方法は、139の ニュース記事(5,464文章・203,454文字)をピックアップし、読みやアクセントなどの間違いを、2018 年8月リリース版・2020年3月リリース版・最新の2022年12月リリース版で比較し、最新版では94.07% の精度となりました。3バージョンの調査結果は以下の通りです。
「医療用語拡張版辞書」は、医学用語、医薬品名、医療機関名など、約11万語を登録し、医療関連用語 の読み上げ精度向上を目的とした拡張辞書です。 「医療用語拡張版辞書」を用い、実践医療用語・全国保険医療機関(病院・診療所)一覧・指定難病病 名一覧表などから抽出した195,015件の用語を正しく読み上げるかどうか、社内で調査した結果は以下の通りです。 この拡張辞書を使うと、標準版では読めない用語も含め、医学用語・医薬品名・医療機関名について平均99.03%の読み上げ精度となり、医療用語の読み上げ機会の多いお客様向けにご活用いただける製品です。
また今後、お客様の用途に合わせ、難読な専門用語の正解率向上を目指した拡張版辞書の開発も可能と なります。
■音声合成AITalk®とは
AITalk®は、コーパスベース音声合成方式を採用し、より人間らしく自然な音声で、自由に音声合成をすることができる音声合成エンジンです。
●3つの特徴
①豊富な話者と言語
日本語話者は大人から子供まで男女15種類、関西弁にも対応。外国語は40言語、59方言の豊富な音声ラインナップ。
②感情表現も実現
使用するシチュエーションやご用途に合わせた喜怒哀楽の感情表現を実現。
③誰の声でも合成データに
芸能人や声優、自分の声でも短時間の収録で音声合成用データに変換。
※1:プランにより収録文章数が異なり、また個人によって読上げスピードや読み間違い等があるため、収録時間に差があります。
※2:一般的に収録文章数が多いほど音質は向上します。ご用途によって最適な収録数・音声辞書作成方法をご提案いたします。
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像