【AI】「富岳」で和製生成AI 東工大や富士通、23年度中に

1 :田杉山脈 ★:2023/05/22(月) 22:24:14.10 ID:bBIcG9/g.net
東京工業大学や富士通などは22日、スーパーコンピューター「富岳」を使って2023年度中に高度な生成人工知能(AI)を開発すると発表した。日本語を中心とした基盤技術を構築し、24年度から国内企業などに無償で提供する。米オープンAIの「Chat(チャット)GPT」などが世界で注目を集める中、日本の産学が連携して自前技術で対抗する。

開発には理化学研究所や東北大学も参加する。生成AIの基盤となる大規模言語モデルを独自に開発する。AIの学習にはオンライン百科事典の「ウィキペディア」などで公開されている日本語のデータなどを使い、日本語の対話能力を高める。日本企業として独自の生成AIの開発を目指すサイバーエージェントとも連携する。

日本でも生成AIを開発する動きはあるが、性能を左右するパラメーター数は数十億程度であることが多い。サイバーが17日に公開した大規模言語モデルも最大68億だ。東工大などはチャットGPTの基盤である「GPT-3」の1750億に近い1000億程度のパラメーター数を持つ大規模言語モデルなどを構築する。

大規模なモデルの構築には高い計算能力を持つスパコンが必要だが、日本の民間企業は世界的な競争力のある機種を保有していない。世界ランキング2位の富岳を運営する理研などは新たに生成AIの開発を重点テーマと位置づけ、開発した大規模言語モデルは産業界や研究機関が活用できるよう公開する。

富岳は生成AIの学習に適した画像処理半導体(GPU)などを搭載していない。ただ、国内にあるAIの計算に特化したスパコンと比べても「富岳は高性能のCPU(中央演算処理装置)を多く搭載しており、AI開発でも性能は高い」(富士通)として活用を決めた。

オープンAIなどの米テクノロジー企業は外部企業に対して学習済みのAIを提供するケースが多い。東工大などは基盤となる大規模言語モデルそのものを公開し、日本企業などが自前のデータで学習させて独自の生成AIを開発できるようにする。
https://www.nikkei.com/article/DGXZQOUC223IT0S3A520C2000000/

2 :名刺は切らしておりまして:2023/05/22(月) 22:32:39.73 ID:2O2bwGzi.net
計画時点で遅れているな。
パラメーター数は次世代型で数十兆じゃなかったのか?
3 :名刺は切らしておりまして:2023/05/22(月) 22:37:30.25 ID:8GFllozX.net
どうせ書き溜めたテキストから適当なやつ選んで返すのがせいぜいだろ日本なら
4 :名刺は切らしておりまして:2023/05/22(月) 22:52:12.91 ID:QDXJ889m.net
とんでもなく遅いな。種まきからはじめんの?
5 :名刺は切らしておりまして:2023/05/22(月) 23:03:35.02 ID:3Qu9OsZ4.net
日本発のとか日本人による、、とか今の時代にこだわる必要があるの?
発想がすでに負け戦なんだよなあ
6 :名刺は切らしておりまして:2023/05/22(月) 23:19:35.91 ID:bk/MY4HoB
python動きそう?
7 :名刺は切らしておりまして:2023/05/22(月) 23:07:09.20 ID:ZhB5sb+J.net
発想が二番煎じ
10年遅い
8 :名刺は切らしておりまして:2023/05/22(月) 23:17:18.65 ID:5N+D/VGD.net
東ロボくん、早々に失敗したくせに
9 :名刺は切らしておりまして:2023/05/22(月) 23:21:02.81 ID:Zl/n/e7x.net
えぇ富士通 
他人の情報出す
10 :名刺は切らしておりまして:2023/05/22(月) 23:28:45.02 ID:x/7bJXtH.net
和製、、、、
嫌な予感しかしない
11 :名刺は切らしておりまして:2023/05/22(月) 23:30:03.54 ID:Ojo18EY4.net
せめて日本語対応だけでも海外製と勝負になったら良いね
12 :名刺は切らしておりまして:2023/05/22(月) 23:30:16.67 ID:c1Ql01Zl.net
いや、この早くも下火になりつつある流れの中で開発続けるのは凄いわ
13 :名刺は切らしておりまして:2023/05/22(月) 23:32:30.73 ID:88agkHjV.net
富士通…(;・∀・)
15 :名刺は切らしておりまして:2023/05/22(月) 23:44:22.69 ID:iwKqiaVR.net
これから開発するのか

ベンチャーでもいまから開発するって言って資金調達できないだろ

どこから金が入ってくんだよ

16 :名刺は切らしておりまして:2023/05/22(月) 23:48:19.26 ID:g/tGfGe+.net
何年遅れだよ
本当にどうしようもないな日本はw
17 :名刺は切らしておりまして:2023/05/23(火) 00:06:58.12 ID:RBDkgiGX.net
周回遅れ過ぎるし8年成果出せない状態でも出資してくれるようなとこがこの国のどこにあんのか知らないけど和製GPTは意味あるよ
一つの言葉に複数の意味を持たせたり複数の言葉で一つの意味を表現したりするこの七面倒な言語に脳みそが英語ベースだと意図を読み切れない部分が大量にあるからクオリティの高い創作物を出力するのに今は手間と時間がいる
だから早いとこ国会図書館の蔵書全部ぶち込んだLLM作って1億総活躍させろ
18 :名刺は切らしておりまして:2023/05/23(火) 00:54:38.75 ID:O0RMg0jQ.net
>日本企業などが自前のデータで学習させて独自の生成AIを開発できるようにする。

学習基盤も大事だろうけどデータはもっと大事だろ?
自前のデータを持ってる日本企業なんてないだろうに。

19 :名刺は切らしておりまして:2023/05/23(火) 01:21:25.97 ID:TF7LiQeS.net
富士通はマイナンバーでもやらかしてるよね大丈夫?
俺の富士通のクロームブックも糞鈍いし音が途中ででなくなる
まじで今年の7月で期限が切れるASUSのクロームブックより劣るんだけど・・
東芝レベルに富士通は信用できねえ
20 :名刺は切らしておりまして:2023/05/23(火) 02:04:56.03 ID:fpVQghK4.net
Wikipediaか。俺たまに書くけど間違えてばかり
修正は面倒だとしないで放置
あまり学習してほしくないなあ
21 :名刺は切らしておりまして:2023/05/23(火) 02:08:14.17 ID:Hq2roIom.net
日本語で集められるデータは英語に比べて極めて少ないから勝負になるんだろうか
24 :名刺は切らしておりまして:2023/05/23(火) 02:54:54.72 ID:wYVvQ/gF.net
>>21
AIとは違って言葉は関係ない
学者が考えた計算式をひたすら繰り返す機械
22 :名刺は切らしておりまして:2023/05/23(火) 02:15:10.47 ID:nWvaAYcj.net
富士通?

とりあえず交付サービスなんとかしてからだろ

23 :名刺は切らしておりまして:2023/05/23(火) 02:37:39.36 ID:vT8KWybP.net
和製に頑張って欲しいのはやまやまだけど
uiがクソすぎて使うだけで心がくじけたりするから、、、
26 :名刺は切らしておりまして:2023/05/23(火) 06:00:09.86 ID:R9daOSXx.net
ある物を使うのは当然の話
スパコンの場合は次世代機の開発を前倒しせんとな

仙台あたりにセンター作ったらエエ
東京大阪神戸以外なら、どこでもエエけど

27 :名刺は切らしておりまして:2023/05/23(火) 06:47:30.54 ID:sE60mDw2.net
わせーせーせー
28 :名刺は切らしておりまして:2023/05/23(火) 07:05:30.78 ID:qpkeKcmb.net
国の事業なら国立国会図書館電子分館作って司書をこいつに
29 :名刺は切らしておりまして:2023/05/23(火) 09:19:09.30 ID:QSqgw4OD.net
飛沫感染シュミレーターとしての延命が難しくなったから
和製生成AIの開発とやらにすがったのか
なかなかしぶといな

引用元:http://anago.2ch.sc/test/read.cgi/bizplus/1684761854