Home / Microsoft / Windows / 【2026年最新版】Windowsの音声入力・ディクテーション機能完全ガイド

【2026年最新版】Windowsの音声入力・ディクテーション機能完全ガイド

※本ページにはプロモーション(広告)が含まれています

【2026年最新版】Windowsの音声入力・ディクテーション機能完全ガイド

「キーボードを打つのが面倒で音声で文字を入力したい」「Windowsに音声入力機能があると聞いたが使い方がわからない」「日本語の音声入力の精度を上げたい」——こうした疑問を持つWindowsユーザーが増えています。

Windowsには Win + H で起動できる音声入力(ディクテーション)機能が標準搭載されており、特別なアプリをインストールしなくても使えます。Windows 11では自動句読点機能も追加され、より自然な文章入力が可能になりました。

本記事では、Windowsの音声入力の基本的な使い方から、自動句読点・音声コマンドによるPC操作、マイク設定と精度向上のコツ、日本語入力のテクニック、Cortanaとの違い、オフライン/オンラインモードの違いまで、2026年最新環境に対応して徹底解説します。

本文画像1

この記事でわかること

  • Win + H で使えるWindowsディクテーション機能の起動方法と基本操作
  • 自動句読点機能(Windows 11)の有効化と活用法
  • 音声コマンドでPCを操作する方法
  • マイク設定と音声認識精度を上げるコツ
  • 日本語音声入力を使いこなすテクニック
  • Cortanaとの違い・使い分け
  • オフライン/オンラインモードの違いと切り替え

Windowsの音声入力(ディクテーション)とは

Windowsのディクテーション機能は、マイクを通じて話した言葉をリアルタイムでテキストに変換する機能です。メモ帳・Word・メール・ブラウザのフォームなど、テキスト入力ができるほぼすべての場所で使用できます。

Windows 10では「音声入力」として搭載され、Windows 11ではさらに進化して「自動句読点」「音声入力ランチャーの自動起動」などの新機能が追加されました。クラウドベースの音声認識エンジンを使用しているため、認識精度も年々向上しています。

ディクテーション機能の主な特徴

  • 追加インストール不要(Windows標準機能)
  • 日本語・英語など複数言語に対応
  • テキスト入力可能なあらゆる場所で使用可能
  • Windows 11では自動句読点機能あり
  • 音声コマンドでカーソル操作や削除も可能

音声入力の起動方法と基本操作

起動方法

テキスト入力欄(メモ帳、Wordなど)をクリックしてカーソルを置いた状態で、キーボードショートカット Windows キー + H を押します。画面上部または中央に音声入力ツールバーが表示されます。

初回起動時はマイクのアクセス許可を求めるダイアログが表示されます。「許可」をクリックしてください。

基本操作の流れ

  1. テキスト入力したい場所にカーソルを置く
  2. Win + H を押して音声入力ツールバーを起動
  3. マイクアイコンをクリックして録音開始(またはツールバー起動と同時に自動開始)
  4. 話しかける——発話した内容がリアルタイムでテキストに変換される
  5. 入力を止めるにはマイクアイコンをクリック、または Win + H を再度押す

音声入力ツールバーの各ボタン

ボタン 機能
マイクアイコン 録音の開始/停止
設定アイコン(歯車) 自動句読点・音声入力ランチャーなどの設定
ヘルプアイコン 使用可能な音声コマンドの一覧表示

自動句読点機能(Windows 11)の設定と活用

Windows 11で追加された「自動句読点」機能を有効にすると、話し終わりや間の取り方に応じて句読点(。、)が自動的に挿入されます。いちいち「まる」「とうてん」と発声する必要がなくなり、自然な話し方で文章が完成します。

自動句読点を有効にする方法

  1. Win + H で音声入力ツールバーを起動
  2. ツールバーの歯車アイコン(設定)をクリック
  3. 「自動句読点」のトグルをオンにする

自動句読点の精度と注意点

  • 日本語では「。」(句点)と「、」(読点)が自動挿入される
  • 話すスピードや間合いによって精度が変わる
  • 誤って挿入された場合は通常どおりバックスペースで削除可能
  • 英語での使用時には「.」「,」「?」「!」なども自動挿入される
本文画像2

音声コマンドでPCを操作する

ディクテーション機能では、テキスト入力だけでなく、音声コマンドを使ってカーソル操作や編集操作を行うことができます。

主な音声コマンド一覧

音声コマンド 実行される操作
「削除」 直前の単語を削除
「クリア」 認識候補をクリア
「改行」 Enterキーを押す(改行)
「スペース」 スペースを1文字挿入
「句読点なし」 次の発話で自動句読点を無効化
「ディクテーションを停止」 音声入力を終了

英語モードでは「select [テキスト]」「delete [テキスト]」「go to end of line」など、より豊富な音声コマンドが使用できます。日本語での音声コマンドは現時点では英語ほど充実していないため、基本的な編集操作はキーボードと併用するのが効率的です。

マイク設定と音声認識精度の向上

音声入力の認識精度はマイクの品質と設定に大きく左右されます。以下の設定を最適化することで精度が向上します。

マイクを正しく設定する

  1. スタート → 設定 → システム → サウンドを開く
  2. 「入力」セクションで使用するマイクを選択
  3. 「入力音量」スライダーを70〜80%程度に設定(高すぎると音割れ、低すぎると認識しない)
  4. 「マイクのテスト」ボタンで実際に声を出して入力レベルを確認

マイクの詳細設定(音声認識向け)

  1. 設定 → システム → サウンド → 「その他のサウンド設定」をクリック
  2. 「録音」タブで使用マイクを右クリック → 「プロパティ」
  3. 「レベル」タブ:マイクブーストは0〜10dBが推奨(高すぎるとノイズが増える)
  4. 「拡張機能」タブ:「ノイズ抑制」と「エコーキャンセレーション」をオンにする

音声認識精度を上げる環境づくり

  • 静かな環境で使用する:背景ノイズがあると認識率が下がる
  • マイクの距離を一定に保つ:口から15〜30cm程度が理想的
  • ヘッドセットマイクを使う:内蔵マイクより外付けヘッドセットの方が精度が高い
  • はっきりと話す:早口や小声は認識率が下がる
  • インターネット接続を安定させる:クラウド認識のためWi-Fiより有線LANが安定

日本語での音声入力のコツ

日本語の音声入力には英語と異なる特有のコツがあります。以下のポイントを意識すると認識精度が上がります。

発音と話し方のポイント

  • 単語を区切らず自然に話す:単語ごとに区切って話すより、文章として自然に話す方が認識精度が高い
  • 標準的な発音を意識する:地域の方言や強いアクセントは誤認識されやすい
  • 専門用語は後で修正する:固有名詞や専門用語は誤変換が多いので、後でキーボードで修正するのが効率的
  • 句読点を明示的に言う:自動句読点がオフの場合は「まる」「てん」「かいぎょう」と発音

変換の修正方法

音声入力で誤変換が発生した場合:

  • 誤変換した部分をマウスで選択してから再度話しかけると上書き修正できる
  • バックスペースで消してから再度発声する
  • キーボードで直接修正する(音声入力中でも通常のキーボード入力は有効)

音声入力が得意な場面・苦手な場面

得意な場面 苦手な場面
長文のメモ・日記の入力 固有名詞・専門用語の多い文章
メールの下書き作成 数字・記号が多い文章
アイデアのブレインストーミング 静かにできない環境での使用
手がふさがっているときの入力 コード・プログラムの入力
文章の大枠を素早く作る 細かい精度が要求される文書作成

Cortanaとの違い・使い分け

Windowsには「ディクテーション(Win + H)」と「Cortana」の2種類の音声機能があります。混同されやすいですが、用途がまったく異なります。

特徴 ディクテーション(Win + H) Cortana
主な用途 テキスト入力(文字を書く) 質問応答・タスク実行・検索
使い方 入力欄にカーソルを置いてWin + H タスクバーのCortanaアイコン または音声で「コルタナ」
出力先 現在のカーソル位置にテキストとして入力 Cortanaの画面(テキストは入力されない)
できること 文字の入力のみ ファイル検索・リマインダー設定・アプリ起動など
インターネット オンライン(クラウド認識)/ オフライン対応 基本的にオンライン必須
日本語対応 対応 日本語は機能が限定的

使い分けの基本:文章や文字を入力したいときはディクテーション(Win + H)、PCに対して何かを「させたい」(検索・アプリ起動・情報を調べる)ときはCortanaと使い分けると便利です。

本文画像3

オフライン/オンラインモードの違い

Windowsのディクテーション機能はデフォルトでクラウド(オンライン)の音声認識エンジンを使用していますが、インターネット接続なしのオフラインでも基本的な音声入力が可能です。

比較項目 オンラインモード オフラインモード
認識エンジン Microsoftクラウド(Azure Speech) Windows内蔵エンジン
認識精度 高い(継続的に改善) やや低い
対応言語数 多言語対応 限定的
自動句読点 対応(Windows 11) 非対応
プライバシー 音声データがMicrosoftのサーバーに送信 データはPC内のみで処理
インターネット要件 必要 不要

オフライン音声入力を使う場合の注意

オフライン使用時は認識精度がオンラインより下がります。機密情報を扱う環境や社内ルールでクラウドへのデータ送信が制限されている場合はオフラインモードを選ぶ意味がありますが、通常の使用ではオンラインモードの方が快適です。

音声入力に関するよくある質問(FAQ)

Q. Win + H を押しても音声入力が起動しない。なぜ?

A. 以下を確認してください:①マイクが正しく接続・設定されているか(設定 → システム → サウンド → 入力)、②マイクのアクセスが許可されているか(設定 → プライバシーとセキュリティ → マイク → 「マイクへのアクセス」がオン)、③テキスト入力可能なフィールドにカーソルがあるか。

Q. 音声入力中に認識が突然止まる。対処法は?

A. インターネット接続が不安定な場合や、マイクの入力レベルが低すぎる場合に発生します。①接続を安定させる、②マイクの入力音量を上げる、③Win + H を再度押して再起動する、のいずれかをお試しください。

Q. 日本語と英語を混在して音声入力できますか?

A. 音声入力の言語はWindowsの表示言語設定に依存します。日本語設定のまま英単語を発音すると、カタカナや日本語読みに変換されることがあります。英語のキーワードが多い場合は入力言語を英語に切り替えてから使うか、後でキーボードで修正するのが確実です。

Q. スマートフォンのGoogleアシスタントやSiriと比べて精度はどうですか?

A. 日本語の精度はGoogleの音声入力(Googleドキュメントの音声入力など)の方が高いケースが多いです。長文の音声入力にはGoogleドキュメントの音声入力機能を使う方法も有効です。一方、Windowsの標準ディクテーションはWindowsのあらゆるアプリで使える汎用性が最大の利点です。

Q. 音声入力で入力した内容はMicrosoftに送られますか?

A. オンラインモード使用時は、音声データが処理のためにMicrosoftのサーバーに送信されます。Microsoftのプライバシーポリシーに基づき処理されます。機密情報の入力にはオフラインモードの使用、またはオフラインの音声入力専用ツールの使用を検討してください。

Amazonおすすめ製品

まとめ

Windowsの音声入力(ディクテーション)機能は、Win + H という簡単なショートカット一つで起動できる便利な標準機能です。本記事で解説した内容の要点をまとめます:

  • 起動方法:テキスト入力欄にカーソルを置いて Win + H を押すだけ
  • 自動句読点:Windows 11のツールバー設定からオンにすると、「まる」「てん」と言わなくても自動挿入
  • 音声コマンド:「削除」「改行」などの基本コマンドでキーボード操作を減らせる
  • 精度向上:外付けマイク使用・静かな環境・適切な入力音量設定が鍵
  • Cortanaとの違い:ディクテーションは「文字を入力」、Cortanaは「PCを操作・検索」と役割が異なる
  • オフライン対応:インターネットなしでも使えるが、精度はオンラインより低い

まずは Win + H でツールバーを起動して、メモ帳などに試しに話しかけてみましょう。最初は誤認識があっても、使い方に慣れるにつれて効率よく活用できるようになります。手首や指の疲れを軽減する補助ツールとしても非常に有効です。

Check Also

CLIP STUDIO PAINTが起動しない・落ちる原因と解決法完全ガイド

【2026年最新版】CLIP STUDIO PAINT(クリスタ)が起動しない・落ちる原因と解決法完全ガイド

はじめに:クリスタが起動しない …