DNPが生成AIの回答精度を上げる「ドキュメント生成機能」を開発、24年1月提供開始

生成AIが学習できる整形データで誤回答を削減、企業や自治体の学習データを加工

大日本印刷(DNP)は、生成AI(人工知能)の学習に適したデータ形式にPDFやWordなど多様なドキュメントを整形する技術を開発した、と12月14日発表した。生成AIの誤回答や非回答を削減して高精度の回答が得られる。生成AIの学習データ加工・収集に課題を持つ企業・団体に2024年1月から提供し、契約書や帳票類、業務マニュアルが膨大な自治体や金融機関に生成AI活用した業務のDX(デジタル変革)につなげるサービスを開発する。

整形データを学習した生成AIと、学習していない生成AIとの回答例の比較

テキスト、画像、表組みが混在したドキュメントから、タイトルや本文、画像や表の内容、キャプションなどの要素ごとにコンテンツを分割し、生成AIが学習しやすいデータ形式に整形する。大量の文書も高速に処理できる。DNPは、5月に生成AIを活用する社内環境を構築して、社内規定や品質マニュアル、決算短信などのドキュメントを整形して生成AIに学習させることで、誤回答を約90%削減することに成功した。

生成AIは回答精度の低さが課題で、外部から正しい知識、情報、データを与えることが有効とされている。政府も、生成AIの利用ルールを議論する「AI戦略会議」で政府保有のデータを開発者に提供する方針を決めている。ただ多くのデータがPDF形式で、生成AIが効果的に学習・参照するには情報を適切な形に整形する必要があった。この課題を解決するため、DNPは多様なドキュメントを生成AI向けのデータに整形する技術を開発した。

生成AIの回答精度を高めるデータ整形技術の概要

この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

ディープリンク
WWW上でのリンクの張り方の1つ。サイトのトップページへのリンクではなく、個別コ ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]