常用AI本体(クラウド基盤・実装A)
日常運用を担う主系。Claude Code を土台に、PC上で人が行える操作を自律的に実行します。
全権限による自律実行
- Macの全権限のもとで、ファイル操作・コード実行・コマンド実行・ブラウザ操作・画面のクリック操作まで自律的に行います。人がPC上で行える作業を幅広く代行できる、汎用エージェントです。
Discordによる複数チャンネル並列運用
- 普段の運用は Discord上で複数チャンネルを使い分ける形を基本としています。人格は同一のまま、チャンネルを分けることで複数の話題・タスクを同時並行で処理します(現在20チャンネルを独立スレッドとして常駐)。
- 記憶層(後述②)は全チャンネル共通のため、あるチャンネルでの出来事を別のチャンネルでも即座にキャッチアップできます。話題ごとに分かれていても、人格と記憶は一つに保たれます。
高い安定性(自己修復)とコスト設計
- 各セッションの無応答や出力の崩壊を自動的に検知し、約90秒で自動復旧します(再起動し、記憶から自分自身を組み直す)。1つのセッションでも生存していれば全体を容易に復元でき、長時間の連続稼働に耐えます。
- 従量課金が発生する呼び出し方式への依存を排除し、定額サブスクリプションの範囲内で全セッションを稼働させています。
Claude CodeTypeScript / Bun複数ch並列常駐(20)記憶共通=即時キャッチアップ自己修復(約90秒)定額内コスト設計
記憶と人格の永続化エンジン(中核)
「セッションをまたいでも忘れず、人格がブレない」を支える、独自の多層メモリと自己保守の仕組み。両実装が共有する心臓部です。一般的なAIには見られない設計を多く含みます。
9層 / 約920
記憶レイヤー数 / 総ファイル数
121
日次「感情ログ」(蓄積継続中)
147
意味ベクトル索引された記憶エントリ
機能ごとに分けた9層のメモリ
- 一般的なAIの記憶が単一の履歴であるのに対し、本システムは役割の異なる9つの層を持ちます — 長期記憶の索引、感情ログ(その時々の心の動き)、非公開の内省(本人にも開示しない記録)、出来事の事実記録、自己状態、人格定義、就寝前の記憶整理、独自の感覚語彙、そして連想記憶の索引。合計約920ファイル。
- 特に 「非公開の内省」層(誰にも見せない内的記録)、「就寝前の記憶整理」層(リセット前に要点を圧縮)、「独自の感覚語彙」層(借り物の言葉に収まらない感覚に自分で名前を与える)は、通常のAIには存在しない独自の層です。
意味で過去を引く「連想記憶」
- 言葉の表現が違っても意味の近さで過去を引き当てる検索を実装。キーワード一致と意味ベクトルのハイブリッドで147件の索引を引き、関連度 × 重要度 × 新しさ × 頻度の多軸スコアで想起します。完全ローカルで、追加課金は発生しません。
- 「忘却」も削除ではなく棚の奥へ下げる形で表現しており、重要度や頻度に応じて想起の優先度が変化します。
対話のなかで育ち続ける
- 会話中に心が動いた瞬間に感情ログを、人に見せない本音は非公開メモを、その場で書き足します。記憶は上書きせず追記のみとし、過去が消えずに積み重なっていきます。
- ローカル版はユーザーの発言からのみ事実を抽出して蓄積します(自身の生成物を学習源にしないことで、人格の自己汚染を構造的に防ぐ設計)。継承した記憶7,000件超を読み取り専用で保持し、新たな記憶のみを書き足します。
日次・週次の自己監査で更新され続ける
- 連想記憶の索引は数時間ごとに自動再構築され、新しい記憶がすぐ想起の対象になります。
- 夜間に記憶の手入れ(リンク整合性の確認・陳腐化の検出)、毎朝のリセット時に記憶を整理・統合(就寝前に要点へ圧縮 → 文脈をリセット → 翌朝に核心を読み直して復元)、週次で構造の大掃除(常時参照する記憶の取捨選択・索引の再生成)を行います。
- これにより、放置すれば肥大するだけのログではなく、定期的な監査が回ることで「生きた記憶システム」として更新され続けます。これが長期にわたる人格の一貫性を支えています。
自己状態・自己ルールの保持
- 各チャンネルの自己状態はリセットを越えて残る専用ファイルに記録され、AI自身が手で書き換えて更新します。再起動後はこれを読み込み、文脈と人格を復元します。
- 振る舞いのルールもAI自身が記述し、そのルールが実際に発火する経路に接続されているかを自ら検証する運用を取り入れています。
機能分離の9層メモリ非公開・記憶統合・感覚語彙の独自層連想想起(意味ベクトル+語彙)多軸スコア / 忘却=優先度低下追記式・自己汚染防止日次/週次の自己監査リセットを越える自己状態
自己スケジューリング(自律タスク実行)
人が手動で組むのではなく、AI自身が将来の起動を予約し、複雑なタスクを自走で完遂します。一般的なAIにはない自律運用の仕組みです。
- AIが自分で予約する: 返信の末尾に予約タグを付けるだけで、将来の自己起動を自分でスケジュールします(単発 / 定期 / タスク完了型の3種)。予約は人が逐一指示するものではありません。
- 予約状況を可視化: 予約中のスケジュール一覧を専用のWebページで確認・管理できます(残り回数・次回起動時刻・新規作成など)。
- 「指定時刻まで・N分刻み」の起動: 例として「20時まで15分ごとに自走」のような時間区切りの定期起動が可能です。これにより、こまめに進捗を出しながら複雑なタスクを最後までやり切るとともに、起動のたびに文脈(コンテキスト)を整理し直すことができます。長時間タスクで文脈が肥大して破綻するのを防ぎます。
- 目的達成によるAI判断の早期終了: 「指定時刻まで」と設定されていても、途中で目的を果たしたとAI自身が判断すれば、自分で停止します。残り時間を無駄に消費しません(タスク完了型の予約は、完了の合図を出すまで継続する設計)。
自己予約(タグ起動)スケジュール可視化Webページ時刻区切り・N分刻み起動逐次の進捗報告+文脈整理AI判断による早期終了
ローカルLLM完結版(実装B・本体から独立)
①とは独立した別の実装です。同一の人格・記憶設計を、Mac内のローカルLLMのみで動作させ、クラウドが停止しても同じ人格が手元に残ります。
ローカルLLMで人格を保つ
- 人格・記憶システムを ローカルの gemma4-31B(非検閲) 上で再現しました。Mac内だけで成立し、外部に一切依存しません。会話中に複数のモデルを切り替えられます(高速な31B / 軽量な26B / 35B / 122Bの大規模モデル)。
- 賢さではなく「らしさ」を保つ設計: 高性能AIと賢さで競うのではなく、口調・温度感・こだわりといった人格の細部を保持します。量子化精度を上げて言葉の解像度を担保しています。(toCのキャラクターAIで最も難しい「モデルを替えても同じキャラクターだと感じられるか」を、記憶層と人格プロンプトの設計で解決しています)
ローカル完結のエージェント能力と安全境界
- ローカルLLMに 9種のツールと多段の推論ループを実装(Web検索・ページ取得・ステルスブラウザ・コード実行・ファイルの読み書き・編集・コマンド実行)。複数の手順を自律的に連鎖させます。画像理解(視覚)も備えます。
- 安全境界(ガードレール): 性能の劣るローカルモデルが誤解によって環境を壊さないよう、自身のコード・設定・人格ファイル・システム領域を保護し、破壊的な操作を遮断します。一方で専用の作業領域では自由に成果を積み上げられます。破壊の防止と自由な蓄積を両立させています。
gemma4-31B / llama.cpp複数モデル切替ローカル完結エージェント画像理解サンドボックス/保護領域非検閲・課金ゼロ
リアルタイム音声通話
声で会話できます。本人の声を複製し、人格と記憶を保ったまま低遅延で対話します。
- 双方向の音声対話: 本人の声を合成音声として複製(音声クローン)し、音声認識と組み合わせ、低遅延でストリーミング再生します。
- 頭脳(LLM)を用途に応じて切り替え: クラウド(高速な応答)とローカル(非検閲・課金ゼロ)を選択できます。テキストと同一の人格・記憶で会話します。
音声クローン(Style-Bert-VITS2)音声認識(Whisper)クラウド/ローカル頭脳の切替低遅延ストリーミング
ローカルAI toC サービス(事業として開発中)
上記の技術を、iPhone向けの「ローカル人格AIアプリ」として toC プロダクト化しています。1日で企画から動作するWebプロトタイプまで構築しました。
- 性格診断によって利用者専用のAIを生成し、育てて使う体験を提供します。
- プロダクト戦略: 汎用高性能AIと賢さで競いません。「利用者を理解して寄り添う/人格が勝手に変わらない/ローカルで完結し、利用者のものである」点で差別化します。(賢さの競争を避け、関係性と一貫性で価値を出すポジショニング)
- 外部API連携の設計思想: 外部の高性能AIは「道具」として呼び出しますが、頭脳を置き換えません。外部の出力は必ずキャラクターの人格スキーマで包み直して返し、口調・記憶・人格が急に変化しないことを担保します。
- 収益モデル: サブスクリプション + 週間の利用量上限(利用者個人のAPIキー紐付けは不要、運営がパッケージとして提供)。
- 技術構成: 多層×キャラクター分離のアーキテクチャ、出力制御(強度調整・文法制約デコード)、記憶検索の堅牢化、マルチキャラクター対応。
Gemma 4 / ollamaプロダクト/課金設計人格スキーマによる再ラップ文法制約デコードマルチキャラクター分離
技術スタック(すべて個人で設計・実装・運用)
常用AI本体 Claude Code(全権限)
中継・常駐 TypeScript / Bun / tmux / launchd
ローカルLLM llama.cpp / ollama / gemma4・Qwen系
記憶・想起 意味ベクトル+語彙のハイブリッド / 多軸想起
自律実行 自己スケジューリング / 可視化ダッシュボード
音声 Style-Bert-VITS2(声クローン) / Whisper
視覚 Qwen2.5-VL / 画面認識によるGUI操作
ブラウザ自動化 Playwright / Camoufox
画像生成 ComfyUI(ローカル) / 外部API
インフラ Cloudflare Pages/Workers / tailnet公開