OpenHuman 5일 써 봤다: 지금까지 써 본 AI Agent 중 가장 「사람 같다」

AI 노트  ·  2026.05.27  ·  읽는 데 약 9분

집에서 노트북으로 OpenHuman 개인 AI 디지털 트윈을 쓰는 모습 — 사람 같은 Agent 경험

한 주 동안 디지털 생활의 입구를 데스크톱 앱 OpenHuman으로 바꿨다. 클릭 두 번짜리 리뷰가 아니라 Mac에서 5일 연속 켜 두고 Gmail·Calendar·GitHub를 붙인 뒤, 대략 20분마다 백그라운드 동기화를 지켜보며 매일 아침 「오늘 뭐부터 할까?」를 물었다. 4일째쯤엔 맥락을 기억하는 동료처럼 다뤘다. 「가장 사람 같다」는 주관이지만, 프로덕션에서 돌려 본 Agent 중 OpenHuman은 처음으로 지속적인 정체성을 기본 제품 경로에 넣었다.

아래는 엔지니어 시각의 필드 노트다. 「사람 같다」가 실제로 무엇인지, 아직 소프트웨어인 부분, ChatGPT·OpenClaw와 어떻게 나눠 쓰는지, 상시 동기화에 클라우드 Mac이 필요한지. 아키텍처 깊이는 OpenHuman 디지털 트윈 가이드를 보면 된다.

5
일 실전 운용
4
핵심 데이터 소스
20
분 동기화 주기

1일차: 소프트 설치보다 신입 온보딩에 가깝다

DMG 설치와 Gmail·Calendar OAuth 연결은 15분 안팎이었다. 진짜 놀란 건 그날 저녁이다. 긴 프롬프트를 한 번도 붙여 넣지 않았는데 Memory Tree에 내일 회의와 답장 대기 스레드 Markdown이 이미 있었다. TokenJuice가 긴 HTML 메일을 읽을 수 있는 요약으로 압축한다. 「모델이 똑똑하다」가 아니라 퇴근 전에 누가 받은편지함을 정리해 둔 느낌이다.

ChatGPT를 처음 열면 반대다. 뛰어나지만 기본은 백지. OpenHuman은 이미 어느 정도 이해된 상태를 전제로 한다. 이게 「사람 같음」의 첫 층: 맥락을 쌓고 대화한다.

「사람 같다」의 기준 — 내가 쓴 네 가지 테스트

  • 실제 기록을 인용한다 — 지난주 고객 메일 팔로업했는지 물으면 Memory Tree 조각을 가리킨다. 생산성 일반론이 아니다.
  • 모르는 건 인정한다 — 동기화 안 된 Slack 채널은 「여기 기록 없음」이라고 한다. 허구 답변보다 낫다.
  • 브리핑 톤, 영업 톤이 아니다 — 「AI 언어 모델로서」가 줄고 「수요일에 말했던」「캘린더 기준」이 늘었다. EA 아침 메모에 가깝다.
  • 앱을 가로지른다 — 회의, 열린 PR, Notion 스펙이 「오늘의 우선순위」로 묶인다. Memory Tree와 멀티 소스 동기화 결과다.

의식이 있는 건 아니다. 「사람 같다」는 상호작용의 은유이고, 자기 설명을 덜 한다. 감정 동반·SNS 자동 포스팅을 기대하면 아직 실망한다.

5일 타임라인: 신기함에서 의존으로

일차 느낀 점 사람 같음 (주관)
1일차 트리가 성기고 요약이 가끔 빗나감 ★★☆☆☆
2~3일차 동기화 안정, 「어제」 요약이 맞음 ★★★★☆
4일차 아침에 ChatGPT만이 아니라 OpenHuman을 먼저 연다 ★★★★☆
5일차 뚜껑 닫으니 요약 멈춤 — 24시간 동기화 필요성 인지 ★★★☆☆ (하드웨어 한계)

5일차 하락이 중요하다. 사람 같은 느낌은 백그라운드 pull에 달려 있다. 노트북을 닫거나 Wi‑Fi가 끊기면 휴가 간 동료 같다. 고장 난 소프트가 아니라 시간 연속성이 끊긴다. 그래서 동기화를 클라우드 Mac mini로 옮겼다.

ChatGPT, OpenClaw, 코딩 Agent와 비교

ChatGPT는 즉흥 글쓰기, 브레인스토밍, 일회성 딥다이브에 강하다. OpenHuman은 「앱과 날짜를 가로지르는 나」에 강하다. 5일 뒤 습관은 초안은 ChatGPT, 하루 계획은 OpenHuman. 순수 IQ가 오른 건 아니어도 생활 맥락 기억은 확실히 다르다.

OpenClaw는 엔지니어링 온콜 전화다. Telegram 트리거, 빌드 영수증, 종료 코드. OpenHuman은 옆자리 동료 — 셸 실행은 약하지만 메일·문서는 잘 읽는다. 겹쳐 쓰기 좋다: OpenHuman이 개인 맥락, OpenClaw가 CI에 액션을 연결. 클라우드 Mac CI의 OpenClaw도 참고.

Claude Code / Cursor는 레포 담당. OpenHuman은 「오늘의 당신」 담당. 코딩은 Cursor 그대로, 스탠드업 전에 OpenHuman에게 「오늘 회의 많아?」를 묻는다 — 이상하지만 캘린더 전환이 줄어든다.

사람 같음 ≠ 최강 Agent

파일 40개 리팩터는 코딩 Agent로. 매일 아침 30분 우선순위를 머릿속으로 재구성한다면 5일 OpenHuman 체험이 낫다. 먼저 물어보자: 기억이 필요한가, 실행이 필요한가.

같은 주에 밟은 함정

  • OAuth·Composio 경계 — 커넥터는 편하지만 컴플라이언스는 메일 경로를 묻는다. 민감 고객 스레드는 연결하지 않았다.
  • 요약은 여전히 디테일을 잃는다 — 긴 스레드의 첨부 결정이 TokenJuice에서 사라질 때가 있다. 계약 건은 Memory Tree를 눈으로 확인한다.
  • 완전 오프라인은 아니다 — 「로컬 우선」은 기억이 디스크에 있다는 뜻. 모델 라우팅은 클라우드 API일 수 있다. 에어갭은 Ollama와 기능 축소를 감수해야 한다.
  • 뚜껑 닫으면 동기화 멈춤 — Mac을 깨어 있게 하지 않으면. 항상 켜 있는 창업자·컨설턴트에게 클라우드 호스트는 거의 필수다.

Mac 사용자: 「사람 같은」 느낌을 끊기지 않게

내 절충안: 일상은 노트북, OpenHuman 백그라운드 동기화와 일부 GitHub 폴링은 ZavCloud M4 인스턴스에서 — 뚜껑을 닫아도 Memory Tree가 갱신된다. 가끔 VNC로 기억 파일을 본다. 「어시스턴트는 아직 근무 중」. 팀용 Mac mini vs 클라우드 Mac과 같은 논리: 사람은 움직이고, 연산은 고정할 수 있다.

가끔 글 쓰고 메일이 적다면 항상 켜 둔 노트북으로 충분할 수 있다. iOS 빌드와 OpenClaw Runner도 돌린다면 Agent 동기화와 Xcode CI를 한 클라우드 Mac에서 시간대를 나눠 통합 메모리 싸움을 피하자.

체험기 면책

2026년 5월 공개 빌드 기준 개인 경험. Tiny Humans 스폰서 아님. 제품은 빠르게 바뀐다 — 공식 문서를 믿어라. 「가장 사람 같다」는 내 주관적 기준이지 경쟁사 평가가 아니다.

이 5일 실험, 누가 다시 해 볼 만한가

  • 창업자·어드바이저 — 메일·캘린더가 빽빽하고 매일 우선 브리핑이 필요하다.
  • 엔지니어링 리드 — GitHub 신호와 회의를 스크립트 없이 보고 싶다.
  • 이미 Claude Code 쓰는 개발자 — 부족한 건 생활 맥락이지 터미널 Agent 하나 더가 아니다.

가벼운 채팅이나 IM에서 CI만 쏘고 싶다면 OpenHuman이 첫 정거장은 아닐 수 있다 — 먼저 OpenHuman vs OpenClaw 경계를 읽는 편이 시간을 아낀다.

결론: 5일이면 「상주」를 진지히 고민할 만했다

OpenHuman은 IDE도 ChatGPT도 대체하지 않았다. 극대화한 건 좁은 축 하나: 내가 나를 설명하는 횟수가 줄었다. 그게 내 「사람 같음」이다. 튜링 테스트가 아니라 실제 워크플로에서 되찾은 대역이다.

해 보려면 Calendar, 메일, 실제로 쓰는 문서나 코드 소스를 각각 연결하고 1일차 똑똑함으로 판단하지 마라. 4일째 「이게 없으면 뭘 모르는가」를 물어라 — 차이가 분명하면 Mac을 깨어 있게 하거나 클라우드 Mac 호스팅으로 동기화를 옮겨라. 나에게는 「또 하나의 AI 장난감」에서 데스크톱의 두 번째 눈으로 바뀌었다 — 2026 Agent 경쟁에서 흔치 않은 승리다.

ZavCloud · 클라우드 Mac

뚜껑을 닫아도 OpenHuman은 「근무 중」

Mac mini M4 전용 인스턴스: 24시간 Memory Tree 동기화, 고정 IPv4, VNC 스팟 체크 — 개인 트윈과 iOS CI를 같은 감사 가능한 macOS 레이어에서.

플랜 및 요금 보기
클라우드 Mac Mac mini 온라인 대여