メインコンテンツまでスキップ

OCR文字認識と翻訳

OVR Overlay Translatorは、最先端のローカル加速OCR(光学文字認識)技術を使用して、VR環境の視野前方のテキストをキャプチャして抽出します。

適用範囲と認識能力

市場にあるフルスクリーンをクラウドに送信して処理する必要があり、極めて高い遅延が発生する翻訳ツールとは異なり、このソフトウェアは、プレイヤーがコントローラーで領域を区切った後:

  1. ローカルで直ちにVRゲームの歪みのないフレームをキャプチャします。
  2. デプロイされた高性能推論ライブラリを呼び出してテキスト領域のマージを処理し、縦書き、横書き、さらに不規則な混在した行間隔のゲームUI要素にも良好に対応できます。

細かい調整段落に入る方法またはぼやけた画像をシャープにする方法を知りたい場合は、UI設定 -> OCR設定の説明を参照してください。

翻訳サービス

OVR Overlay Translatorは、さまざまなニーズを満たすために複数の翻訳サービスをサポートしています。

翻訳モード

内蔵モード

ソフトウェアが提供する翻訳サービスを使用し、箱から出してすぐに使用できます。

特徴

  • APIキーを設定する必要がありません
  • ネットワーク検証が必要です

注意:一部のサービスは一時的に利用できない場合があり、インターフェースではグレーアウトして無効になって表示されます。

カスタムモード

自分自身のAPIキーを使用し、翻訳サービスを完全に制御します。

特徴

  • 自分のアカウントを使用し、制限がありません
  • カスタマイズ可能なモデルとプロンプト(LLMモード)
  • APIキーの手動設定が必要です

サービスタイプ

汎用翻訳エンジン

「文対文」に基づく従来の機械翻訳で、応答速度が速いです。

ベンダー説明
テンセント翻訳君テンセントクラウド翻訳サービス
マイクロソフト翻訳Microsoft Translator
ボルケーノエンジンバイトダンス翻訳サービス
アリババクラウドアリババクラウド機械翻訳
百度翻訳百度翻訳API
有道翻訳ネットイース有道翻訳
Google翻訳Google Translate
DeepLDeepL翻訳サービス
ファーウェイ翻訳ファーウェイクラウド翻訳

LLM翻訳エンジン

大規模言語モデルに基づく翻訳サービスで、翻訳結果がより自然です。

ベンダー説明
OpenAIGPTシリーズモデル
DeepSeekDeepSeek大規模モデル
通義千問アリババクラウド通義大規模モデル
豆包バイトダンス豆包大規模モデル
SiliconFlowSiliconFlowモデルプラットフォーム

モデル選択

LLM翻訳エンジンを使用する場合、さまざまなモデルを選択できます:

  • 自動:システムがデフォルトモデルを自動的に選択します
  • 指定モデル:手動でモデル名を入力または選択します

内蔵モードでは、システムが自動的に利用可能なモデルリストを取得して選択できるようにします。

カスタムプロンプト

LLM翻訳を使用する場合、翻訳効果を最適化するために翻訳プロンプトをカスタマイズできます。

デフォルトプロンプト

あなたは翻訳の専門家です。翻訳するテキストはOCR認識の結果であり、一部のエラーや段落の切り捨て、または複数の言語の混在がある可能性があります。すべてのテキストを統合し、最も適切なターゲット言語の翻訳結果を提供してください。

プロンプト最適化の提案

  1. 翻訳スタイルを指定する:「口語表現を使用する」または「正式な書き言葉を使用する」など
  2. 専門用語を処理する:「ゲーム中の固有名詞は翻訳せずに保持する」など
  3. フォーマット要求:「原文の改行フォーマットを保持する」など

サポートされている言語

ソフトウェアは30言語の相互翻訳をサポートしています:

言語コード
自動検出auto
英語en
中国語(簡体)zh
中国語(繁体)zh-TW
日本語ja
韓国語ko
フランス語fr
ドイツ語de
スペイン語es
ポルトガル語pt
イタリア語it
ロシア語ru
アラビア語ar
ヒンディー語hi
タイ語th
ベトナム語vi
インドネシア語id
トルコ語tr
ギリシャ語el
オランダ語nl
ポーランド語pl
スウェーデン語sv
ノルウェー語no
デンマーク語da
フィンランド語fi
ハンガリー語hu
チェコ語cs
ブルガリア語bg
ルーマニア語ro
スロベニア語sl