トピック

ICT支援員がAIを育てる、教育ノウハウ継承と情報流出防止にローカルLLMで挑戦

EDIX関西・日本HPブース講演レポート⑤

教員の成り手不足やベテラン教員の大量退職、働き方改革など、教員の人材育成はさまざまな課題を抱えている。なかでも、ベテラン教員から若手教員へ、どのように技術やノウハウを継承していくのか、また限られたリソースの中で若手人材をどのように育てていくのか。今までのやり方を見直す時期にきている。

こうした課題解決に有効な手段のひとつがAIだ。ICT支援員の分野でも同様の課題を抱えており、生成AIとHPのワークステーションを活用した興味深い取り組みが始まった。EDIX関西の株式会社日本HPのブースに登壇した、合同会社かんがえる 代表 五十嵐晶子氏と株式会社SENTAN 代表取締役 松田利夫氏による「『ICT支援員の頼れる相談相手』となれる生成AIの育成をワークステーションで実施」ついてレポートする。

生成AIを使いたいけど、データの扱いが不安

ChatGPTが登場して以降、一般ユーザーが手軽に使える会話型の生成AIツールが増え、さまざまなアプリの機能としても組み込まれるようになった。また、データの追加学習で自分好みにカスタマイズしたAIチャットボットを作成する機能も出ており、特定の分野に強いチャットボットや、自分の分身のようなチャットボットを作ることも可能だ。

こうした生成AI関連のサービスはクラウド側で処理が行われているため、会話の内容やカスタマイズ用のデータはインターネットを経由してサービス側に送信される。各サービスは、ユーザーの会話履歴や追加学習データを安全に管理し、AIモデルの再学習に利用しない設定や有料プランなどを設けているが、クラウドにデータを上げることに不安を感じたり、職場のルール上禁止されていて使用できない人も多い。

ICT支援員向けの研修などを行う合同会社かんがえる 代表 五十嵐晶子氏もそこに不安を感じていたひとり。ChatGPTのユーザーとして、カスタマイズ版を作成できるGPTsの機能も使っていたが、個別の学校の事情などを反映した情報を追加学習データとして送信するのは躊躇していたという。

合同会社かんがえる 代表 五十嵐晶子氏

こうした不安要素を解消できるよう、生成AIをローカル環境のコンピューターで運用できるシステムを提案しているのが、株式会社SENTANの代表取締役 松田利夫氏だ。

株式会社SENTANの代表取締役 松田利夫氏

HPのワークステーションで実現、ローカル環境でのAI処理

対話型の生成AIを支えるLLM(大規模言語モデル)の処理には、非常に高い処理能力のコンピューターが必要だ。一般ユーザー向けのPCで対応できるレベルではないため、現在提供されている生成AIサービスの多くは、クラウド上のサーバー側で処理されている。

このAIの処理を、ローカル側のコンピューターで実現するのがHPの高性能ワークステーション「HP Z6 G5 A Workstation」だ。AMD Ryzen Threadripper PROプロセッサーが搭載され、AIの処理や3Dモデリング、ビジュアルエフェクト制作などに十分なパフォーマンスを発揮する。

このワークステーションにSENTAN社の「Smart AI Toolbox」を搭載することで、LLMを稼働させ、独自のデータで追加学習を行ってオリジナルのAIチャットボットを作り運用することができる。

HPの高性能ワークステーション「HP Z6 G5 A Workstation」
高負荷の処理に対応する「HP Z6 G5 A Workstation」(EDIX関西のブース展示より)

五十嵐氏はかねてから、自身が持っているICT支援員に関するノウハウや、現場での対処法などAIチャットボットの形にして提供したいと考えていた。このワークステーションを使えば、ローカルで安心安全に追加学習が行えることから、「私の分身をつくりたい」と考え、松田氏と協業することとなったという。

追加学習に使用するのはテキストデータで、五十嵐氏がこれまで書いた記事や講演原稿、サポートのチャット履歴などを提供している。こうして、五十嵐氏がICT支援に関する学習用データを提供し、松田氏がSmart AI ToolboxでAIの追加学習を行う、いわば共同で「AIを育てている」というわけだ。

学習データとして話し言葉が多く使用されれば、五十嵐氏のしゃべり方や説明の癖も反映される。現在は音声データの文字起こしの精度も上がってきているので、今後、音声や動画を元に学習用のテキストを用意する可能性もあるということだ。

Smart AI Toolbox ダッシュボード画面。ここからAIナビ(チャットへの問い合わせ画面)や学習用のメニューに遷移する
学習させたLLMにチャット形式で問い合わせを行っている画面。問い合わせるLLMは切り替えが可能
LLMの学習を行うメニュー。「元データのクレンジング・成形」→「プリトレーニング」→「ファインチューニング」→応答の調整(仕上げ)という順番でLLMの学習を進めていく

ICT支援員に必要なコミュニケーション能力をサポートしたい

五十嵐氏はICT支援員に必要なスキルは、IT全般や教育系アプリ群の知識に加えて、コミュニケーション能力が最も重要だと話す。しかし現実には、ITの知識があってもコミュニケーションで苦戦する人が多いという。しかも、学校や地域によってICT環境や慣習、目指す方向性が違うため、現場に入らないとわからないことも多い。

そこで、学校現場で円滑なコミュニケーションができるよう、ノウハウや手法の部分をAIチャットボットに反映できれば、支援員の事前学習に有効活用できると五十嵐氏は期待を寄せる。ベースとなるIT技術の知識などの部分は、別途、松田氏が適切な学習リソースを元に網羅的に学習させている。

AIで支援の充実を実現できないかと期待を寄せる(五十嵐氏のスライドより)

AIチャットボットにどこまでプライベートな内容を学習させるかは、そのボットを誰が何の目的で利用するのかを踏まえて慎重に検討する必要がある。ただし、ローカル環境で学習させる場合は、心おきなく安心してデータを扱えるのがメリットとして大きい。たとえば、特定の組織内限定で使用することが前提ならば、クラウドでは許可されなかったような内部情報や文書も学習させられる可能性がある。

AIの専門家でなくとも、AIに「食べさせる情報」は自分で用意する

「AIは自分で育てて、自分のために使える道具になった」と松田氏
「AIに“食べさせる情報”はたくさん持っています」と五十嵐氏

松田氏は「AIというのは、すごく遠く離れた誰かがやってくれるものではなくて、自分が育てて、自分のために使う道具と考えましょう。自分でさわれるものだと思ってください」と、AI活用の視点をアップデートするよう呼びかけた。

また本事例のように、オリジナルのAIチャットボットを自分で作り出すという使い方もそのひとつだが、もう1点、松田氏が強調したのは学習データの言語に関することだ。

「学習データが日本語でなければいけないという先入観は捨ててください。多くのITや教育に関する素晴らしい資料や論文は英語で書かれ日本語化されていません。これらを英語のままAIに学習させることができます」と松田氏は説明する。学習データ自体の言語が何であっても、出力は日本語で五十嵐氏の特徴を反映したAIチャットボットにすることができるのだ。

五十嵐氏も、「私はAIの専門家ではありませんが、AIに“食べさせる情報”はたくさん持っています。技術がわからなくても、英語が苦手でも、AIを育てることはできます」と話し、聴衆のAIに対するイメージのハードルを下げた。

なお、松田氏によると、このシステムで現在使用しているLLMはMeta社のLlama 2だが、どのLLMを使用するかも、開発にあたって主体的に選択できる。また、ワークステーションの購入は高価なイメージがあるかもしれないが、条件をそろえて比較すると、クラウドを利用するよりもコストを安価に抑えられるという。

EDIX関西 日本HPのブースで講演。「AIを育てる」という話題に来場者の関心も高い

現実には、個人が手元のワークステーションでAIを利用するよりも、組織の活用用途が多いだろう。ワークステーションは、オンプレミスのローカルネットワーク上で使用できるため、たとえば、教育機関独自のAIチャットボットをつくるなど、さまざまな活用が可能になる。

五十嵐氏はセッションの中で「自分の記憶が衰えても、自分がいなくなっても、自分のナレッジを残したいと思いませんか?」と語りかけた。教育分野の専門知識やノウハウをどのように継承していくのか……AI活用を通してさまざまなアイデアの試行が始まっている。