「諦聴」地震波大規模言語モデル(LLM)が28日、四川省成都市で発表された。同LLMは國家スパコン成都センター、中國地震局地球物理研究所、清華大學が共同開発した、初の1億パラメータ數地震波LLMだ。
成都スパコンセンター運営管理有限公司の郭黎會長によると、同センターと中國地震局地球物理研究所は2023年9月に「地球LLMイノベーション応用共同実験室」を共同建設し、清華大學や中國科學院地質?地球物理研究所と共同で「諦聴」地震波LLMのトレーニングを開始した?!钢B聴」データセットは中國初で、中國の內外で現在最大規模で、サンプルの種類と注釈が最も全面的な地震學専門AIトレーニングデータセットの一つだ。実験室の研究者は半年以上に渡り「諦聴」データセットを利用し、初の1億パラメータ數の地震波LLMを手にした。
中國地震局地球物理研究所の陳石氏は、「地震學は観測科學だ。長期的に見ると、重大なブレイクスルーは観測データへの深い理解から得られることが多い。伝統的な方法と中小規模のモデルでは現在、100TBや1000TBレベルの地震観測データをフル活用できないが、これらのデータは地震學の研究に対して重要な意義を持つ。LLMによって深く掘り起こすしかない」と説明した。
陳氏は、「『諦聴』LLMは大量のデータを利用し、先進的なAI技術を通じ、すでに地震波の識別の精度とペースを大幅に上げている」と述べた。
「中國網日本語版(チャイナネット)」2024年7月31日