Hikarimaru Kobayashi — Personal AI Systems

人格が変わらず、記憶を持ち続け、本人のものとして自律稼働する
パーソナルAIの設計・実装・運用(個人開発)

汎用AI(ChatGPT・Claude等)が抱える「セッションをまたぐと記憶が途切れる/人格が安定しない/クラウドに依存する」という課題に正面から取り組み、記憶を蓄積し続け、人格が一貫し、ローカルで完結するAIを単独で構築しました。クラウド常用版とローカルLLM完結版という、2系統の独立した実装を運用しています。

キャラクター/パーソナルAIを toC で開発するうえで本質的に難しい「永続的な記憶・人格の一貫性・システムの自己保守・プライバシー」を、実運用に耐える水準で解決しています。

① 常用AI本体全権限・複数ch並列・自己修復
② 記憶・人格蓄積し続け監査で保守
③ 自己スケジュール自分で予約し可視化
④ ローカル版クラウド非依存の別実装
⑤ 音声通話固有の声×複数の頭脳
⑥ toC事業人格AIアプリ(開発中)

全体像 — 同一の人格による「2つの実装」

実装A / クラウド常用
高機能AI本体(日常運用の主系)
Claude を頭脳とし、PCの全権限であらゆる操作を自律実行します。複数のチャンネルで並列に常駐し、自己修復機構によって安定稼働します。日々の実作業はこちらが担い、性能と実行力を最大化した系統です。
実装B / ローカルLLM完結
ローカル人格AI(クラウド非依存)
同一の人格・記憶設計を、Mac内のローカルLLM(gemma4-31B)のみで動作させる、まったく別の実装です。外部サービスが停止しても同じ人格が手元で稼働し続けます。非検閲・追加課金ゼロ・完全プライベートが特長です。

2つは別個のソフトウェアですが、人格定義と記憶層(後述②)を共有します。性能を担うクラウド版と、独立性・プライバシーを担うローカル版が、互いを補完する構成です。

01

常用AI本体(クラウド基盤・実装A)

日常運用を担う主系。Claude Code を土台に、PC上で人が行える操作を自律的に実行します。

設計上の選択 — 公式 Claude Code ランタイム上で並列起動

全権限による自律実行

Discordによる複数チャンネル並列運用

並列セッションを堅牢に立てる構成

高い安定性(自己修復)とコスト設計

Claude CodeTypeScript / Bun複数ch独立並列(21)自作ゲートウェイ中継tmux+launchdで常駐(50+ジョブ)接続監視→対象限定の自動修復記憶共通=即時キャッチアップ自己修復(約90秒)定額内コスト設計
02

記憶と人格の永続化エンジン(中核)

「セッションをまたいでも忘れず、人格がブレない」を支える、独自の多層メモリと自己保守の仕組み。両実装が共有する心臓部です。一般的なAIには見られない設計を多く含みます。

9層 / 約920
記憶レイヤー / 総ファイル数
約22,000
意味ベクトル索引(チャンク単位)
7,000+
継承記憶(読取専用で保持)

機能ごとに分けた9層のメモリ

意味で過去を引く「連想記憶」

対話のなかで育ち続ける

日次・週次の自己監査で更新され続ける

自己状態・自己ルールの保持

機能分離の9層メモリ非公開・記憶統合・感覚語彙の独自層連想想起(意味ベクトル+語彙)多軸スコア / 忘却=優先度低下追記式・自己汚染防止日次/週次の自己監査リセットを越える自己状態
03

記憶の知識グラフ化と「連想オントロジー」

蓄積した記憶を、ただ貯めるのではなく意味で結んだ3D知識グラフに構造化し、その構造を実際の想起にフィードバックさせた中核機能の発展形。記憶どうしの「つながり方」を型付きで定義し、AI自身の連想を可視化・強化します。

962 / 約6,900
ノード数 / エッジ数(意味の結び)
7種
関係オントロジー(向き付き)
0% → 66%
「経験→教訓」の想起到達率(後述)
3D知識グラフ全景
記憶・プロジェクト・人物を意味で結んだ3Dグラフ(ノード種・関係種を凡例で絞り込み・回転可)
ノード詳細と関係の説明
ノードを選ぶと、つながる記憶が関係の種類と「なぜ繋がるか」付きで表示される
▶ 構造デモ(内容は非公開・操作のみ): dia-graph-demo.pages.dev

記憶を意味で結んだ3D知識グラフに

「ただ似ている」ではない関係オントロジー

グラフを「実際の想起」に効かせる(測定済み)

想起の質を守る軽量LLMゲート

プライバシー設計と自動更新

3D知識グラフ(962ノード/6.9千エッジ)7種の関係オントロジー(向き+説明)想起拡張 0→66%(測定)軽量LLM適合ゲート(可逆・無停止)公開/限定の2系統プライバシー夜間差分・全ローカル更新
04

自己スケジューリング(自律タスク実行)

人が手動で組むのではなく、AI自身が将来の起動を予約し、複雑なタスクを自走で完遂します。一般的なAIにはない自律運用の仕組みです。

運用ダッシュボード — 稼働中チャンネル
運用ダッシュボード: システム稼働状況と並列セッションの実行状態(実行中 / 最終稼働)
運用ダッシュボード — スケジュール
AI自身が予約したスケジュール済み自律タスクの一覧(時刻・対象・繰り返し)
自己予約(タグ起動)スケジュール可視化Webページ運用コンソール(稼働/予約の可視化)時刻区切り・N分刻み起動逐次の進捗報告+文脈整理AI判断による早期終了
05

ローカルLLM完結版(実装B・本体から独立)

①とは独立した別の実装です。同一の人格・記憶設計を、Mac内のローカルLLMのみで動作させ、クラウドが停止しても同じ人格が手元に残ります。

ローカルLLMで人格を保つ

ローカル完結のエージェント能力と安全境界

gemma4-31B / llama.cpp複数モデル切替ローカル完結エージェント画像理解サンドボックス/保護領域非検閲・課金ゼロ
06

リアルタイム音声通話

声で会話できます。このAIに固有の合成音声(独自に作成したキャラクターの声)で、人格と記憶を保ったまま低遅延で対話します。

独自音声合成(Style-Bert-VITS2)音声認識(Whisper)クラウド/ローカル頭脳の切替低遅延ストリーミング
07

ローカルAI toC サービス(事業として開発中)

これまでの技術を、iPhone向けの「ローカル人格AIアプリ」として toC プロダクト化しています。性格診断から利用者専用のAIを生成し、育てて連れ歩く体験。汎用高性能AIと賢さで競うのではなく、「理解して寄り添う・人格が勝手に変わらない・利用者だけのもの」で差別化します。

利用者のスマホ内で完結する小型モデル

小型でも人格がブレない — クラウド/ローカル版の記憶基盤を移植

高性能モデルは「道具」として呼び出す

課金設計

端末内完結の小型LLM基本利用コストゼロ人格保持=多層メモリ移植高性能AIを道具呼び出し人格スキーマで再ラップ買い切り+外部APIサブスクの課金設計

技術スタック(すべて個人で設計・実装・運用)

常用AI本体 Claude Code(全権限)
中継・常駐 TypeScript / Bun / tmux / launchd
ローカルLLM llama.cpp / ollama / gemma4・Qwen系
記憶・想起 意味ベクトル+語彙のハイブリッド / 多軸想起
自律実行 自己スケジューリング / 可視化ダッシュボード
音声 Style-Bert-VITS2(独自音声合成) / Whisper
視覚 Qwen2.5-VL / 画面認識によるGUI操作
ブラウザ自動化 Playwright / Camoufox
画像生成 ComfyUI(ローカル) / 外部API
インフラ Cloudflare Pages/Workers / tailnet公開