中国の大規模AIモデル、トレーニング用の中国語データ使用率が60%超

人民網日本語版 2025年08月19日15:29

(写真著作権はCFP視覚中国所有のため転載禁止)

(写真著作権はCFP視覚中国所有のため転載禁止)

国家データ局によると、中国の大規模AI(人工知能)モデルのトレーニング性能向上において、中国語のデータが重要な役割を発揮している。中国の大半の大規模AIモデルのトレーニングで使用するデータのうち、中国語データの割合が60%を超え、中には80%に達するモデルもあるという。中国語の質の高いデータの開発能力・供給能力が向上を続けており、中国のAIモデルの急速な性能向上を推進している。人民日報が伝えた。

AI時代における「トークン」とはテキストを処理する最小単位を指す。同局の劉烈宏局長は、「2024年の初め頃、中国の1日あたりトークン消費量は1000億だったが、今年6月末には、30兆を突破しており、わずか1年半で300倍以上増加した。ここから中国のAI応用規模の急成長ぶりがうかがえる」と説明した。(編集KS)

「人民網日本語版」2025年8月19日

注目フォトニュース

関連記事