こんにちは!最近、AIの話題を耳にしない日はないですよね。特に生成AIは、テキストや画像、動画といった新しいコンテンツを生み出す能力で、私たちの生活や仕事に大きな変化をもたらしています。
先日、東京都の教育委員会が都立学校256校すべてに安全フィルター付きのGPT-4oを導入し、生徒14万人、先生2万人がAIを活用した学習を始めるという発表がありました。5年後には、AI学習経験を持つ若者たちが社会に出てくることを考えると、私たち大人も生成AIに関する基礎知識を一般教養として身につける必要がありそうです。
しかし、生成AIの進化は目覚ましく、新しい概念や用語が次々と登場しています。そこで、これだけは押さえておきたい生成AIの基礎用語50選を厳選してご紹介します。
目次
生成AIの基礎用語集
1. 基本概念とモデルの種類
- 生成AI: 画像や文章など、新しいデータを作り出すAIの総称です。ChatGPTや画像生成AIなどがこれに該当します。
- モデル: AIが学習した結果である「脳」そのもの。アルゴリズムと重みが詰まったファイルで、アプリはこれを呼び出して答えを作ります。GPT-4やGPT-4o Miniなどがこれにあたります。
- LLM (大規模言語モデル): 大量の文章を学習し、人の質問に答えたり、文章を生み出したりできる巨大な言語AIモデルです。ChatGPT、Claude、Geminiなどが代表例です。
- AGI (汎用人工知能): 人間と同等以上のあらゆる知的作業をこなす、AIの最終的な目標とされる仮想の概念です。現状の生成AIはまだ達成していませんが、近い将来の到達が期待されています。
2. モデルの学習・最適化手法
- 知識蒸留: 大きなモデルの知識を、より小さいモデルに移して軽量・高速化する技術です。GPT-4o Miniなどに使われています。
- 機械学習・ディープラーニング: データからパターンを学ぶAIの作り方で、大規模モデルの土台となっています。
- ファインチューニング: 既存のモデル全体を再学習させ、特定の分野やタスクに特化させる技術です。企業が自社データを使ってカスタムチャットボットを作る際などに重要です。
- LoRA (ローラの技術): 既存モデルに軽い追加パーツだけを学習させ、低コストで微調整する技術です。主に画像生成AIのStable Diffusionなどで使われます。
- RLHF (人間のフィードバックによる強化学習): 人間の評価(「こっちの回答がいい」など)をAIに与え、AIの振る舞いを改善していく方法です。
- ゼロショット: サンプル事例を何も与えずにAIとやり取りを行う手法です。
- フューショット: 背景情報やサンプル事例をいくつか見せてAIとやり取りを行う手法です。
3. プロンプト設計と制御技術
- プロンプト: AIとの対話やシステムにおいて、ユーザーが入力する指示や質問のことです。
- システムプロンプト: 「敬語で答える」「個人情報禁止」など、AIに絶対守らせる最優先の指示書です。MyGPTsなどで事前に埋め込んでおけるプロンプトもこれにあたります。
- プロンプトエンジニアリング: 望むAIの振る舞いを引き出すための入力設計技法です。ロール設定、制約、具体例などを組み合わせて、最終的な応答品質を最適化します。
- テンプレートプロンプティング: 固定されたひな形に変数だけを入れて呼び出すことで、一貫した出力を得る運用方法です。
- プロンプトインジェクション: 悪意のある指示をAIに与え、秘密情報の漏洩などをさせる攻撃手法です。
- Chain of Thought (COT): AIに思考の途中経過を「話させる」ことで、正解率を上げる方法です。GPT-4oなどの推論モデルに採用されています。
- COTトレース: Chain of Thoughtの思考過程のログを保存し、誤回答の原因を後から分析できる仕組みです。
4. 推論フローと対話管理
- トークン: 単語、句読点、部分単語など、モデルが1単位として扱う最小の意味単位です。AIの文章生成はこのトークンを単位として行われます。
- コンテキストウィンドウ: AIが一度の会話で覚えていられるトークン数の上限です。長いほど、より多くの情報を記憶して対話できます。
- ハルシネーション: AIが事実確認をせずに、まるで自信満々に嘘の答えを出す現象です。根拠を提示させたり、人間のチェックで軽減できます。
- エージェント: LLMを目的達成の主体として扱う設計概念です。目標を与えると、計画、ツールの実行、振り返りを自動で行い、結果を届けます。
- MCP (モデルコンテキストプロトコル): ルール、タスク、メモなどを区分けしてAIに渡す共通フォーマットです。LLMと外部アプリケーションを効率的に接続する仕組みです。
- バイブコーディング (雰囲気コーディング): 会話で要望を伝え、AIがコード生成、即実行、出力評価を繰り返す、高速PDCA型の開発スタイルです。非エンジニアでもアプリ開発が可能になる手法として注目されています。
5. 検索・知識拡張データ手法
- ナレッジ: AIが持つ一般知識に加え、企業マニュアルなど外部データをまとめた「知識の倉庫」です。
- ナレッジカットオフ: AIが最後に学習した日付のこと。それ以降の出来事は知らないことを意味します。
- ベクトルの埋め込み (エンベッティング): 言葉や画像を多次元の数字の点(ベクトル)に変換し、意味が近いものを近くに並べる表現手法です。似ているデータを高速に探す検索や推薦エンジンで重要です。
- ベクトルデータベース: 画像や文章のベクトルを保存し、似たデータを素早く見つけられるデータ保管庫です。
- RAG (検索拡張生成): ベクトル検索で取得した文章をプロンプトに連結し、根拠付きの回答を生成する技術です。ハルシネーションの抑制や最新情報の反映に有効です。
- AI検索: AIを活用し、ユーザーの意図や文脈を理解して最適な検索結果を提供するシステムです。従来のキーワード検索と異なり、質問を理解し、より正確で理解しやすい回答を直接提示できます。
- ディープリサーチ: 生成AIがWebや論文を自律的に収集・分析し、引用付きレポートを作成するAI調査アシスタント機能です。
- LLMO (大規模言語モデル最適化): 検索エンジンではなく、ChatGPTなどの生成AIに自分のサイトや文章を正しく理解・引用してもらうためのコンテンツ最適化手法です。SEOの次世代版とされています。
6. マルチモーダルとメディア生成
- VLM (ビジョン言語モデル): 画像を見て文章を出すなど、視覚と言葉を合体させたモデルです。ChatGPTも画像認識機能を持っています。
- T2I (テキスト・トゥ・イメージ): 自然言語の説明を入力すると、その内容に合致する画像をゼロから生成するモデルです。
- I2I (イメージ・トゥ・イメージ): 既存画像を入力し、別の見え方へ変換・編集する仕組みです。テキストと組み合わせて画像を加工します。
- T2V (テキスト・トゥ・ビデオ): 数秒のテキストプロンプトだけで、秒単位の動画クリップを生成するモデルです。
- TTS (テキスト・トゥ・スピーチ): 文字を読み上げ、AIが声に変えて読み上げる仕組みです。
- STT (スピーチ・トゥ・テキスト) / 音声認識: マイクで拾った声をAIがリアルタイムで文字に変換する技術です。字幕表示や音声操作などで活用されます。
- マルチモーダル: 文字、画像、音声など複数の情報をまとめて理解し、生成できるAIです。
7. 運用(オペレーション)
- インテグレーション: 複数の異なる要素を組み合わせて一つに統合したり、連携させたりするプロセスのことです。
- LLMOps (大規模言語モデルオペレーションズ): 大規模言語モデルを社内サービスとして安定安全に回すための運用ノウハウとツール群をまとめた新分野です。
- AIワークフロー: AI技術を業務プロセスに組み込み、タスクの自動化や意思決定を支援する仕組みです。
- API (アプリケーションプログラミングインターフェイス): 異なるアプリケーションやソフトウェア同士をつなぎ、データや機能を共有するための仕組みです。
- JSON: データを「名前: 値」の形式で記述する軽量ファイル形式です。人が読めてコンピュータも理解しやすいため、Webやアプリの共通語として使われます。
- YAML: インデントとコロンだけで階層を表すメモ書き風の設定ファイルです。JSONと似ていますが、リスト形式のデータ構造に適しています。
8. ハードウェアとプラットフォーム
- NVIDIA: GPUを主力とする米国企業で、ゲーム向けで有名ですが、今はAI計算が得意な最新GPUを開発し、世界中のAIスーパーコンピューターを支えています。
- NPU (Neural Processing Unit): 脳の仕組みを真似た回路で、AI計算を低電力でこなすAI専用チップです。
- AI PC: NPUなどAI専用チップを搭載し、ネットに頼らず画像生成や翻訳などを即実行できる新世代ノートPCです。
- Copilot (コパイロット): 「副操縦士」という意味。MicrosoftのAIアシスタントサービスの名前でもあり、WordやExcelでの要約・下書き作成、PC全体の音声・チャット操作など、ユーザーの相棒となるAI機能の総称です。
- チャットボット: AIと会話するようにテキストや音声で応答するプログラムです。LLMを導入しているものは「AIチャットボット」と呼ばれます。
いかがでしたでしょうか?今回ご紹介した用語は、生成AIの世界を理解するための土台となるものです。これらの用語を学ぶことで、最新のAIニュースやサービスがより深く理解できるようになるはずです。
生成AIの進化はこれからも止まりません。新しい技術や概念が出てくるたびに、ぜひ一緒に学んでいきましょう!