リリース1.4.9 2023年10月
Eng | 繁中 | 日本語 | 한국어 | 简中 |
任意のキャラクターとのAIパワードボイスチャット
概要
お気に入りのキャラクターと対面で話すことができます!
- ChatGPTまたはOobaBooga WebUIで実行できる任意のLLMを使用することができます。
- 完全にローカルなオプションも利用可能です。完全に無料かつプライベートな場合は、独自のLLMを実行してチャットを提供することができます。
- 組み込みの多言語音声認識。
- 組み込みの多言語TTSエンジン。900以上の異なる声を持つ英語モデルを含んでいます。他の言語の声もダウンロードできます。
- 組み込みのネイティブなリップシンク。
- 空間オーディオで、スピーカーの位置を見なくてもわかります。
- キャラクターのパーソナリティと説明を簡単にカスタマイズできます。
- チャットメッセージを保存して再生することができます。
- TavernAIなどの人気のあるAIロールプレイプログラムからのキャラクター(JSON形式)も使用できます。
現在の制限事項
- ボイスエンジンはWindowsのみです。現時点ではMac、Android、Questではボイスオプションはありません。
- LLMをDanceXRと一緒に実行するには、パワフルなGPUと大容量のVARMが必要です。リモートセットアップの使用を推奨します。
完全なドキュメント
便利なリンク
- OpenAI https://platform.openai.com/
有名なChatGPTです。AIチャットに使用するためには、OpenAIからAPIキーを取得するために登録が必要です。そのキーをDanceXRのChat Configに入力します。このサービスは無料ではありませんが、十分に安価です。ただし、ChatGPT Plusとは異なるサービスであることに注意してください。ChatGPT Plusのサブスクリプションを持っていても、使用料金が発生します。
- OobaBooga WebUI: https://github.com/oobabooga/text-generation-webui
これはローカルでLLM(Large Language Model)を実行するためのプログラムです。
- WebUIをインストールした後、実行するためのモデルをダウンロードする必要があります。以下はおすすめの2つの無検閲モデルです。
https://huggingface.co/TheBloke/Luna-AI-Llama2-Uncensored-GPTQ(7b、実行が容易) https://huggingface.co/TheBloke/Nous-Hermes-Llama2-GPTQ(13b、よりスマート)
- Runpod: https://www.runpod.io/
これはGPUを借りてAIモデルを実行できるサービスです。独自のWebUIをインストールする手間や、LLMを実行するためのパワフルなハードウェアがない場合に選択肢の1つです。
- 音声ダウンロード:https://rhasspy.github.io/piper-samples/
使用しているTTSエンジンはPiperと呼ばれています。上記のリンクには現在利用可能なすべての声があります。興味がある場合は、独自の音声モデルをトレーニングすることもできます。
モデルの改善点
- スカートと髪の物理演算には、より多くのオプションが用意されました。
- おっぱいとソフトボディの物理演算のための衝突制御が改善されました。
- ドレッシングシステムのトランジション効果を自動更新できるようになりました。
Picoのサポートが向上しました
- カラーパススルーが利用可能です。
- バグ修正
その他の修正と改善
- シーン内に多くのアクターがいる場合のFPSが改善されました。