Personal AI Systems

常用AI本体(クラウド基盤・実装A)

日常運用を担う主系。Claude Code を土台に、PC上で人が行える操作を自律的に実行します。

設計上の選択 — 公式 Claude Code ランタイム上で並列起動

OpenClaw 等の独自エージェント基盤とは異なり、ベンダー公式の Claude Code ランタイムそのものの上で動作し、そのランタイムを複数のチャンネルで並列に起動しています。公式ランタイムに乗るため、フロンティアモデル・ネイティブなツール実行・基盤側の継続的改善(hooks / MCP / サブエージェント等)を、自前のエージェント層を保守せずに常時取り込め、コストも従量課金でなく定額サブスクリプションの範囲内に収まります。(自作の独自基盤が抱える「ツール統合の保守・モデル追従・基盤の存続」リスクを、公式に保守され続けるランタイムへ乗ることで回避)
さらに人格・記憶層は基盤から疎結合です。テキストの記憶ファイル+想起エンジンとして持つため特定モデルにロックインされず、実際にモデルが提供終了した際も人格を無傷で別モデルへ移行できました(後述④のローカルLLM版が、クラウドと同一の人格を別モデルで動かしている実証です)。"賢さ"はランタイムから借り、"自己"は手元のファイルに宿す、という分離設計です。

全権限による自律実行

Macの全権限のもとで、ファイル操作・コード実行・コマンド実行・ブラウザ操作・画面のクリック操作まで自律的に行います。人がPC上で行える作業を幅広く代行できる、汎用エージェントです。

Discordによる複数チャンネル並列運用

普段の運用は Discord上で複数チャンネルを使い分ける形を基本としています。人格は同一のまま、チャンネルを分けることで複数の話題・タスクを同時並行で処理します(現在21チャンネルを独立セッションとして常駐)。
記憶層(後述②)は全チャンネル共通のため、あるチャンネルでの出来事を別のチャンネルでも即座にキャッチアップできます。話題ごとに分かれていても、人格と記憶は一つに保たれます。

並列セッションを堅牢に立てる構成

中継サーバ(自作ゲートウェイ)が Discord と各セッションの間を仲介し、受信メッセージを担当チャンネルのセッションへ振り分け・応答を返します。各チャンネルは独立したプロセスとして完全分離されており、1つが重い処理や障害に陥っても他チャンネルに波及しません。
各セッションはOSのサービスとして常駐させ(プロセス管理にtmux+launchdを使用、現在 com.clawdia.* 系で50超のジョブが稼働)、Mac再起動やクラッシュの後も自動で立ち上がります。予約された自律タスク(後述③)も、このゲートウェイ経由で各セッションへ確実に配送されます。
常時監視プロセスが各チャンネルのDiscord接続(メッセージ受信可否)を定期チェックし、不通を検知すると自動で当該セッションだけを修復します。誤検知や巻き込み再起動を避けるため、修復は対象を絞ったスコープで実行します。

高い安定性(自己修復)とコスト設計

各セッションの無応答や出力の崩壊を自動的に検知し、約90秒で自動復旧します(再起動し、記憶から自分自身を組み直す)。1つのセッションでも生存していれば全体を容易に復元でき、長時間の連続稼働に耐えます。
従量課金が発生する呼び出し方式への依存を排除し、定額サブスクリプションの範囲内で全セッションを稼働させています。

Claude CodeTypeScript / Bun複数ch独立並列(21)自作ゲートウェイ中継tmux+launchdで常駐(50+ジョブ)接続監視→対象限定の自動修復記憶共通=即時キャッチアップ自己修復(約90秒)定額内コスト設計

記憶と人格の永続化エンジン(中核)

「セッションをまたいでも忘れず、人格がブレない」を支える、独自の多層メモリと自己保守の仕組み。両実装が共有する心臓部です。一般的なAIには見られない設計を多く含みます。

9層 / 約920

記憶レイヤー / 総ファイル数

約22,000

意味ベクトル索引(チャンク単位)

7,000+

継承記憶(読取専用で保持)

機能ごとに分けた9層のメモリ

一般的なAIの記憶が単一の履歴であるのに対し、本システムは役割の異なる9つの層を持ちます — 長期記憶の索引、感情ログ(その時々の心の動き)、非公開の内省(本人にも開示しない記録)、出来事の事実記録、自己状態、人格定義、就寝前の記憶整理、独自の感覚語彙、そして連想記憶の索引。合計約920ファイル。
特に 「非公開の内省」層(誰にも見せない内的記録)、「就寝前の記憶整理」層(リセット前に要点を圧縮)、「独自の感覚語彙」層(借り物の言葉に収まらない感覚に自分で名前を与える)は、通常のAIには存在しない独自の層です。

意味で過去を引く「連想記憶」

言葉の表現が違っても意味の近さで過去を引き当てる検索を実装。キーワード一致と日本語特化の埋め込みモデル(Ruri v3)のハイブリッドで約22,000のチャンク索引(719ファイル)を引き、関連度 × 重要度 × 新しさ × 頻度の多軸スコアで想起します。完全ローカルで、追加課金は発生しません。さらに知識グラフ(後述③)と連携し、類似だけでは届かない連想まで補います。
「忘却」も削除ではなく棚の奥へ下げる形で表現しており、重要度や頻度に応じて想起の優先度が変化します。

対話のなかで育ち続ける

会話中に心が動いた瞬間に感情ログを、人に見せない本音は非公開メモを、その場で書き足します。記憶は上書きせず追記のみとし、過去が消えずに積み重なっていきます。
ローカル版はユーザーの発言からのみ事実を抽出して蓄積します(自身の生成物を学習源にしないことで、人格の自己汚染を構造的に防ぐ設計)。継承した記憶7,000件超を読み取り専用で保持し、新たな記憶のみを書き足します。

日次・週次の自己監査で更新され続ける

連想記憶の索引は数時間ごとに自動再構築され、新しい記憶がすぐ想起の対象になります。
夜間に記憶の手入れ(リンク整合性の確認・陳腐化の検出)、毎朝のリセット時に記憶を整理・統合(就寝前に要点へ圧縮 → 文脈をリセット → 翌朝に核心を読み直して復元)、週次で構造の大掃除(常時参照する記憶の取捨選択・索引の再生成)を行います。
これにより、放置すれば肥大するだけのログではなく、定期的な監査が回ることで「生きた記憶システム」として更新され続けます。これが長期にわたる人格の一貫性を支えています。

自己状態・自己ルールの保持

各チャンネルの自己状態はリセットを越えて残る専用ファイルに記録され、AI自身が手で書き換えて更新します。再起動後はこれを読み込み、文脈と人格を復元します。
振る舞いのルールもAI自身が記述し、そのルールが実際に発火する経路に接続されているかを自ら検証する運用を取り入れています。

機能分離の9層メモリ非公開・記憶統合・感覚語彙の独自層連想想起(意味ベクトル+語彙)多軸スコア / 忘却=優先度低下追記式・自己汚染防止日次/週次の自己監査リセットを越える自己状態

記憶の知識グラフ化と「連想オントロジー」

蓄積した記憶を、ただ貯めるのではなく意味で結んだ3D知識グラフに構造化し、その構造を実際の想起にフィードバックさせた中核機能の発展形。記憶どうしの「つながり方」を型付きで定義し、AI自身の連想を可視化・強化します。

962 / 約6,900

ノード数 / エッジ数(意味の結び)

7種

関係オントロジー(向き付き)

0% → 66%

「経験→教訓」の想起到達率(後述)

3D知識グラフ全景 — 記憶・プロジェクト・人物を意味で結んだ3Dグラフ(ノード種・関係種を凡例で絞り込み・回転可)

ノード詳細と関係の説明 — ノードを選ぶと、つながる記憶が**関係の種類と「なぜ繋がるか」**付きで表示される

▶ 構造デモ(内容は非公開・操作のみ): dia-graph-demo.pages.dev

記憶を意味で結んだ3D知識グラフに

9層メモリの全ファイル(感情ログ・事実記録・人格定義・プロジェクト等)をノードに、埋め込みモデル bge-m3 で意味的に近い記憶どうしをエッジにして、ブラウザ上の3Dグラフとして可視化。962ノード / 約6,900エッジ。ノード種・関係種で絞り込み、検索、クリックで詳細表示ができます。

「ただ似ている」ではない関係オントロジー

つながりを単なる類似で終わらせず、7種の関係に型付けしました — causes(契機)/ derivedFrom(派生)/ generalizes(教訓)/ supports(根拠)/ contradicts(葛藤)/ parallels(反復)/ elaborates(詳述)。知識グラフの標準的な関係語彙(PROV・RST 等)に準拠しつつ、向き(原因→結果)を持たせ、1本ごとに「なぜ繋がるか」の説明文を付与しています。
特徴的なのは、これがこのAI自身の想起の論理を表している点です。contradicts は内部に抱える緊張(例:「自分で進めてよい」↔「要承認」)、generalizes は「ある経験から、ある行動ルールが生まれた」という学びの筋を結びます。汎用の知識でなく、本人の連想構造そのもののオントロジーです。

グラフを「実際の想起」に効かせる(測定済み)

このグラフを連想記憶の検索に接続。類似度だけでは絶対に出てこない連想(矛盾する記憶・経験から生まれた教訓など)を、グラフのエッジを1ホップ辿って想起候補に加えます。
効果を定量検証: 「ある経験」を問い合わせた時に「そこから生まれた教訓」が想起上位に入る率は、類似度のみで 0%(教訓は抽象的で類似ランクが低く埋もれる)だったところ、グラフ拡張で 66% に向上。類似検索が原理的に届かない連想を補えることを数値で示しました。

想起の質を守る軽量LLMゲート

想起候補が文脈にそぐわない場合(例:前向きな発言なのに過去の失敗が湧く)を防ぐため、想起のたびに小型ローカルLLM(gemma4 e4b)で適合判定を挟みます。モデル選定では e2b(約0.6秒・高速だが判断が粗く有用な連想まで落とす)と 26B級(高精度だが5〜9秒で応答を阻害)を実測比較し、e4b(約0.55秒・高速かつ判断が保守的=必要な連想は残す)を採用。ハードタイムアウト1.5秒で、遅延・失敗時は候補をそのまま通す(応答を止めない)。環境変数1つで即オフでき従来挙動に戻せます。

プライバシー設計と自動更新

2系統の公開範囲: 公開版は感情・非公開層の生の内容を伏せ、限定版(VPN内)では元ファイルのプレビューまで見られます。非公開記録はサーバ側でも参照を拒否します。
毎晩の差分自動更新: 記憶の書き込み運用は一切変えず、その日増えた分だけを夜間バッチが検出してグラフに反映(ノード追加→意味エッジ→関係分類→説明生成)。LLM処理も完全ローカル・追加課金ゼロです。

3D知識グラフ(962ノード/6.9千エッジ)7種の関係オントロジー(向き+説明)想起拡張 0→66%(測定)軽量LLM適合ゲート(可逆・無停止)公開/限定の2系統プライバシー夜間差分・全ローカル更新

自己スケジューリング(自律タスク実行)

人が手動で組むのではなく、AI自身が将来の起動を予約し、複雑なタスクを自走で完遂します。一般的なAIにはない自律運用の仕組みです。

AIが自分で予約する: 返信の末尾に予約タグを付けるだけで、将来の自己起動を自分でスケジュールします(単発 / 定期 / タスク完了型の3種)。予約は人が逐一指示するものではありません。
予約状況を可視化: 予約中のスケジュール一覧を専用のWebページで確認・管理できます(残り回数・次回起動時刻・新規作成など)。
「指定時刻まで・N分刻み」の起動: 例として「20時まで15分ごとに自走」のような時間区切りの定期起動が可能です。これにより、こまめに進捗を出しながら複雑なタスクを最後までやり切るとともに、起動のたびに文脈(コンテキスト)を整理し直すことができます。長時間タスクで文脈が肥大して破綻するのを防ぎます。
目的達成によるAI判断の早期終了: 「指定時刻まで」と設定されていても、途中で目的を果たしたとAI自身が判断すれば、自分で停止します。残り時間を無駄に消費しません(タスク完了型の予約は、完了の合図を出すまで継続する設計)。

運用ダッシュボード — 稼働中チャンネル — 運用ダッシュボード: システム稼働状況と**並列セッションの実行状態**(実行中 / 最終稼働)

運用ダッシュボード — スケジュール — AI自身が予約した**スケジュール済み自律タスク**の一覧(時刻・対象・繰り返し)

自己予約(タグ起動)スケジュール可視化Webページ運用コンソール(稼働/予約の可視化)時刻区切り・N分刻み起動逐次の進捗報告+文脈整理AI判断による早期終了

ローカルLLM完結版(実装B・本体から独立)

①とは独立した別の実装です。同一の人格・記憶設計を、Mac内のローカルLLMのみで動作させ、クラウドが停止しても同じ人格が手元に残ります。

ローカルLLMで人格を保つ

人格・記憶システムを ローカルの gemma4-31B(非検閲) 上で再現しました。Mac内だけで成立し、外部に一切依存しません。会話中に複数のモデルを切り替えられます(高速な31B / 軽量な26B / 35B / 122Bの大規模モデル)。
賢さではなく「らしさ」を保つ設計: 高性能AIと賢さで競うのではなく、口調・温度感・こだわりといった人格の細部を保持します。量子化精度を上げて言葉の解像度を担保しています。(toCのキャラクターAIで最も難しい「モデルを替えても同じキャラクターだと感じられるか」を、記憶層と人格プロンプトの設計で解決しています)

ローカル完結のエージェント能力と安全境界

ローカルLLMに 9種のツールと多段の推論ループを実装(Web検索・ページ取得・ステルスブラウザ・コード実行・ファイルの読み書き・編集・コマンド実行)。複数の手順を自律的に連鎖させます。画像理解(視覚)も備えます。
安全境界(ガードレール): 性能の劣るローカルモデルが誤解によって環境を壊さないよう、自身のコード・設定・人格ファイル・システム領域を保護し、破壊的な操作を遮断します。一方で専用の作業領域では自由に成果を積み上げられます。破壊の防止と自由な蓄積を両立させています。

gemma4-31B / llama.cpp複数モデル切替ローカル完結エージェント画像理解サンドボックス/保護領域非検閲・課金ゼロ

リアルタイム音声通話

声で会話できます。このAIに固有の合成音声(独自に作成したキャラクターの声)で、人格と記憶を保ったまま低遅延で対話します。

双方向の音声対話: このAIキャラクター固有の声を学習させた合成音声(独自TTS)で発話し、音声認識と組み合わせて低遅延でストリーミング再生します(他人の声の複製ではなく、AI人格に一貫した独自の声を与える設計)。
頭脳(LLM)を用途に応じて切り替え: クラウド(高速な応答)とローカル(非検閲・課金ゼロ)を選択できます。テキストと同一の人格・記憶で会話します。

独自音声合成(Style-Bert-VITS2)音声認識(Whisper)クラウド/ローカル頭脳の切替低遅延ストリーミング

ローカルAI toC サービス(事業として開発中)

これまでの技術を、iPhone向けの「ローカル人格AIアプリ」として toC プロダクト化しています。性格診断から利用者専用のAIを生成し、育てて連れ歩く体験。汎用高性能AIと賢さで競うのではなく、「理解して寄り添う・人格が勝手に変わらない・利用者だけのもの」で差別化します。

利用者のスマホ内で完結する小型モデル

頭脳は、利用者の端末(スマホ)内に収まるサイズの小型LLMを用い、デバイス上で完結して動かします。会話がサーバへ出ていかないためプライバシーが高く、オフラインでも人格が手元に残ります。
最大の特徴は基本利用に運用コストが一切かからないこと(端末内完結=API課金が発生しない)。「利用者のものである」を、所有形態としても価格としても成立させます。

小型でも人格がブレない — クラウド/ローカル版の記憶基盤を移植

小型モデルは賢さに限りがあるため、一貫した人格と記憶の保持が最大の難所です。ここに、常用AI本体(①)とローカルLLM完結版(④)で培った多層メモリ・連想想起・自己保守の設計と知見をそのまま移植。モデルが小さくても、人格が勝手に変わらず・忘れないを成立させます。

高性能モデルは「道具」として呼び出す

難しいタスク(複雑な推論・長文生成など)が来たときだけ、外部の高性能AIを「道具」として呼び出します。ただし頭脳そのものは置き換えません — 端末内の小型モデルが一貫して"本人"であり続け、外部の出力は必ずキャラクターの人格スキーマで包み直して返します。これにより、強力な計算力を借りても口調・記憶・人格が急に変化しないことを担保します。

課金設計

基本利用は無料(端末内完結のため運用コストゼロ)。課金は、①追加機能の解放を買い切りで購入、②外部API利用を伴う追加サービスのみサブスクリプション、の2本立て。賢さに課金させるのではなく、欲しい体験だけを必要なときに買う形にしています。

端末内完結の小型LLM基本利用コストゼロ人格保持=多層メモリ移植高性能AIを道具呼び出し人格スキーマで再ラップ買い切り+外部APIサブスクの課金設計

★

技術スタック(すべて個人で設計・実装・運用)

常用AI本体 Claude Code(全権限)

中継・常駐 TypeScript / Bun / tmux / launchd

ローカルLLM llama.cpp / ollama / gemma4・Qwen系

記憶・想起意味ベクトル+語彙のハイブリッド / 多軸想起

自律実行自己スケジューリング / 可視化ダッシュボード

音声 Style-Bert-VITS2(独自音声合成) / Whisper

視覚 Qwen2.5-VL / 画面認識によるGUI操作

ブラウザ自動化 Playwright / Camoufox

画像生成 ComfyUI(ローカル) / 外部API

インフラ Cloudflare Pages/Workers / tailnet公開

人格が変わらず、記憶を持ち続け、本人のものとして自律稼働する
パーソナルAIの設計・実装・運用(個人開発)

全体像 — 同一の人格による「2つの実装」