中国の大規模AIモデル、トレーニング用の中国語データ使用率が60%超
人民網日本語版 2025年08月19日15:29
(写真著作権はCFP視覚中国所有のため転載禁止)
国家データ局によると、中国の大規模AI(人工知能)モデルのトレーニング性能向上において、中国語のデータが重要な役割を発揮している。中国の大半の大規模AIモデルのトレーニングで使用するデータのうち、中国語データの割合が60%を超え、中には80%に達するモデルもあるという。中国語の質の高いデータの開発能力・供給能力が向上を続けており、中国のAIモデルの急速な性能向上を推進している。人民日報が伝えた。
AI時代における「トークン」とはテキストを処理する最小単位を指す。同局の劉烈宏局長は、「2024年の初め頃、中国の1日あたりトークン消費量は1000億だったが、今年6月末には、30兆を突破しており、わずか1年半で300倍以上増加した。ここから中国のAI応用規模の急成長ぶりがうかがえる」と説明した。(編集KS)
「人民網日本語版」2025年8月19日
注目フォトニュース
関連記事
このウェブサイトの著作権は人民網にあります。
掲載された記事、写真の無断転載を禁じます。
Tel:日本(03)3449-8257 Mail:japan@people.cn
掲載された記事、写真の無断転載を禁じます。
Tel:日本(03)3449-8257 Mail:japan@people.cn