生成AI・自然言語処理技術による材料開発の効率化とChatGPTのプロンプトエンジニアリングの活用
≪こちらはWEBセミナーのお申し込みURLになります≫
■本セミナーの主題および状況
→生成AIは、人工知能の一種であり、データから新しい情報やコンテンツを生成する能力を持つシステムやモデルを指し、自然言語処理は、人間が日常的に使用する言葉や文章をコンピュータや人工知能システムが理解し、解釈し、生成するための技術分野であります。本講習会では、上記のモデル、技術を活用した材料開発のポイントを解説いたします。
→ChatGPTの隆盛からもうかがわれるように、自然言語処理および生成AIは多くの産業や市場で注目を集めており、様々なアプリケーションも並行して開発されており、今後は新規材料開発の場面でより一層の需要と注目を集めることが予想されております。
■注目ポイント
★生成AI・自然言語処理に関する豊富な知見を有する第一人者が、大規模言語モデル(LLM)の概要、生成AIの導入、活用方法から始まり、具体的な材料開発への活用事例、そして現在話題となっているChatGPTのプロンプトエンジニアリングの取り組み方などについて紹介!
★LLMのオープンソースが日々更新されている中で、情報収集にも注力し、様々なツールを目的に応じて適切に使い分ける点についても解説!
★各社が保有する分野特化型の文書を、様々な観点から材料開発に活かすことを念頭に、様々な言語処理の特徴と、材料特化型のツール・モデルについて解説!
★材料開発への情報活用という観点から、自然言語ではない図や数式など、他の情報と組み合わせる(マルチモーダルAI)ことも重要と考えられ、非材料分野におけるマルチモーダルAIの開発についても解説!
- 第1部 三井化学株式会社 DX推進本部 DX企画管理部 兼 信州大学 工学部 特任教授 / 東北大学 材料科学高等研究所 特任教授(招聘) / 大阪大学 基礎工学研究科招聘教授 / MISTEM 合同会社 代表 博士(工学) 向田 志保 氏
- 第2部 物質・材料研究機構/MatQ-lab(個人事業主) NIMS特別研究員 / 個人事業主 吉武 道子 氏
【1名の場合】44,000円(税込、資料作成費用を含む)
定員:30名
※ お申込み時に送られるWEBセミナー利用規約・マニュアルを必ず、ご確認ください。
※ 銀行振り込みをご選択ください。お支払いは会社のご都合で講座前日に間に合わない場合、開催月翌月末あたりまでお待ち申し上げます。
※ お申し込み後、受講票と請求書が自動で返信されます。請求書記載の銀行口座に沿って、お振り込みをお願いします。また請求書に記載の「株式会社」や「(株)」「会社名」はお客様の記入通りの表記になりますので、ご希望の形式で記載をお願いします。
※ 2名以上でお申し込みをされた場合は、請求書受講票を代表者様にご連絡します
※ 領収書の要望があれば、申込時、備考欄へ記載ください。
※ ご参加手続きの際、自宅住所やフリーアドレス、個人携帯番号のみで登録された場合は、ご所属確認をさせいただくことがございます
※ 当講座では、同一部署、申込者のご紹介があれば、何名でもお1人につき11,000円で追加申し込みいただけます。(申込者は正規料金、お二人目以降は11,000円となります)。追加の際は、申し込まれる方が追加の方を取り纏いただくか、申込時期が異なる場合は紹介者のお名前を備考欄にお書きくださいますよう、お願いいたします。
キャンセルポリシー・特定商取引法はこちら
セミナーに関するQ&Aはこちら(※キャンセル規定は必ずご確認ください)
【第1講】 生成AI・自然言語処理による材料開発の効率化とChatGPTのプロンプトエンジニアリングの活用
【時間】 13:00-15:00
【講師】三井化学株式会社 DX推進本部 DX企画管理部 兼 信州大学 工学部 特任教授 / 東北大学 材料科学高等研究所 特任教授(招聘) / 大阪大学 基礎工学研究科招聘教授 / MISTEM 合同会社 代表 博士(工学) 向田 志保 氏
【講演主旨】
昨年末にChatGPTが登場して以来、生成AIはAIの中でも最も急速に進化している分野となっている。化学・生物分野の材料開発においても、ChatGPTをはじめとする膨大なテキストデータを学習する大規模言語モデル(LLM)を用いた特許、文献、報告書からの情報抽出や分子生成といった事例が増えている。本セミナーでは、LLMの概要、生成AIの導入、活用方法から始まり、具体的な材料開発への活用事例、そして現在話題となっているChatGPTのプロンプトエンジニアリングの取り組み方などについて紹介する。
【プログラム】
1. 自然言語処理と生成AIの概要と重要性
1.1 自然言語処理の基礎知識
1.2 生成AIの基礎知識とその重要性
1.3 材料開発における自然言語処理と生成AIの重要性
2. 大規模言語モデルとその活用
2.1 大規模言語モデルの概要
2.2 GPT-3, GPT-4の登場とその特徴
2.3 ChatGPTの概要と活用事例
2.4 プロンプトエンジニアリングとその活用
2.5 生成AIのガイドラインとエチカルな使用
3. 自然言語処理と生成AIの材料開発への活用事例
3.1 特許・文献調査、分類の自動化
3.2 情報抽出とマテリアルDXへの活用
3.3 分子生成における生成AIの活用
4. 自然言語処理と生成AIモデルの選択と活用
4.1 生成AIのソフトウェアやAPIサービス(Azure OpenAI Serviceなど)
4.2 情報収集における自然言語処理と生成AIモデルの使い分け
5. 材料開発における自然言語処理と生成AIの今後の展望
【質疑応答】
【キーワード】
材料開発、自然言語処理、生成AI、大規模言語モデル、LLM、ChatGPT、プロンプトエンジニアリング、化学
【講演のポイント】
LLMの導入のポイントとして、例えばセキュアとされるAzure OpenAI Serviceなどの既存サービスを導入するだけで良いというわけではない。これらのサービスはトークン数に応じた従量課金制であるため、大量の文書を一気に処理する際には注意が必要である。そのため、BERTや従来の自然言語処理とのハイブリッド活用も視野に入れることが想定される。さらに、LLMのオープンソースが日々更新されている中で、情報収集にも注力し、様々なツールを目的に応じて適切に使い分ける点についても触れていきたい。
【習得できる知識】
・生成AI、大規模言語モデル、ChatGPT、プロンプトエンジニアリングの概要
・生成AI周りの様々なサービス、活用方法、およびその注意事項
・生成を活用した化学・生物分野における材料開発のアイディア元
【第2講】 材料科学分野における言語処理:マテリアルズインフォマティクスの一部として
【時間】 15:10-16:25
【講師】物質・材料研究機構/MatQ-lab(個人事業主) NIMS特別研究員 / 個人事業主 吉武 道子 氏
【講演主旨】
【プログラム】
1.1 マテリアルズインフォマティクス/自動・自律実験
材料開発ループと言語処理
情報の種類:物性値、分子構造、結晶構造、化学構造式、物性名、数式、自然言語
1.2 対象とする文書の種類と特徴
論文、特許、書籍、安全・規制に関わる法的文書、社内文書
1.3 言語処理の目的
文書分類、検索(目的文書の抽出)、情報の抽出(文中の特定情報の抽出)、文書間関連付け、関連付けの検索
2.ChatGPTと言語モデル
2.1 ChatGPT:APIとベースとなるGPT
2.2 統計処理ベース(深層学習を含む)の手法の色々
・TF-IDE、N-gramなど
・単語ベクトル:Word2Vec、Doc2Vec
・BERT:pre-trainingとfine-tuning
2.3 文法ベースの手法
・品詞解析
・構文解析/照応解析
2.4 材料関連分野に特化したモデル
a)様々なモデル
Word2Vec系:Mat2Vec
BERT系:SciBERT、BioBERT、BatteryBERT、MatSciBERT、MatBERT、MaterialBERT
ChemNLP
MaterialGPT
b)モデル利用時の注意点
学習データ、単語辞書、モデル計算(初めからor代入?)、学習条件、検証のデータ
3.NIMSでの活用事例
3.1 超電導データベース
3.2 PoLyInfoデータベース
3.3 マテリアルキュレーション支援システム
4.マルチモーダルAI
【質疑応答】
【キーワード】
材料開発、マテリアルズインフォマティクス、言語処理、材料特化型モデル、材料データベース作成
【講演のポイント】
主に、各社が保有する分野特化型の(大量の)文書を、様々な観点から材料開発に活かすことを念頭に、様々な言語処理の特徴と、材料特化型のツール・モデルについて触れる。また、物質・材料研究機構において自然言語処理を用いて生成されたデータベースについても紹介する。さらに、材料開発への情報活用という観点からは、自然言語ではない図や数式など、他の情報と組み合わせる(マルチモーダルAI)ことも重要と考えられ、非材料分野におけるマルチモーダルAIの開発についても触れる。
【習得できる知識】
・材料に特化した言語モデル・ツールの情報とその基礎となる言語処理の考え方
・分野特化型言語モデルの特性評価の現状
・言語処理を用いたデータベース作成例