-
Notifications
You must be signed in to change notification settings - Fork 0
Review sansan.com
이 문서는 sansan.com의 핵심 서비스를 팀 전체가 공통으로 참조할 수 있도록 정리한 레퍼런스입니다. 전체 서비스(팀 기능, 외부 연동, 관리자 기능 등) 분석은 별도 문서에서 다룹니다.
- 포함: 명함 교환 → 데이터화 → 전사 DB 공유 코어 흐름
- 제외: 활동 관리, 마케팅 메일, 디지털 명함 솔루션, 외부 연동(Salesforce 등), 리스크 체크
이 문서는 아래 순서로 구성됩니다.
- 핵심 용어 — 이 문서에서 사용하는 도메인 용어와 정의
- 전체 흐름 — 담당자·시스템 간 상호작용을 Mermaid sequenceDiagram으로 도식화
- 단계별 설명 — 다이어그램의 각 단계를 순서대로 서술
이 문서를 보완할 때는 아래 원칙을 따릅니다.
- 범위 준수: 핵심 서비스(명함 교환 → 데이터화 → 전사 DB 공유) 외 기능은 이 문서에 추가하지 않습니다. 추가가 필요하면 별도 문서를 생성하고, 이 문서의 개요에 링크를 추가합니다.
- 용어 일관성: 새로운 개념이 등장하면 "핵심 용어" 섹션에 먼저 정의한 뒤 본문에서 사용합니다.
- 다이어그램 우선: 흐름 변경이 있으면 Mermaid 다이어그램을 먼저 수정하고, 단계별 설명을 맞춥니다.
- 한국어 작성: 용어 정의는 영문 원어를 병기하고, 설명은 한국어로 작성합니다.
| 용어 | 영문 원어 | 정의 |
|---|---|---|
| 명함 | Business Card | 오프라인 종이 명함. Sansan의 데이터 입력 기점 |
| 데이터화 | Digitization | 명함 이미지에서 이름·회사·직함·연락처 등을 추출해 구조화된 데이터로 변환하는 과정 |
| AI+사람 입력 | AI + Human Data Entry | Sansan의 데이터화 방식. AI가 1차 인식하고 사람이 검수·보완하여 99.9% 정확도 보장 |
| 연락처 | Contact | 데이터화 완료된 명함 1건. 이름·회사·부서·직함·전화·이메일·주소 등을 포함 |
| 전사 DB | Company-wide Database | 조직 전체가 공유하는 중앙 연락처 저장소. 누가 누구와 연결됐는지 전사에서 검색 가능 |
| 스캐너 | Sansan Scanner | Sansan 전용 하드웨어 스캐너. 명함 100장을 최대 5분에 처리 |
| 모바일 앱 | Mobile App | 스마트폰 카메라로 명함을 촬영해 데이터화하는 Sansan 앱 |
| NineOCR | NineOCR | Sansan 자체 개발 Transformer 기반 OCR 엔진. 약 0.3초 만에 명함 인식 결과를 생성 |
| 임시 데이터 | Provisional Data | NineOCR이 즉시 생성하는 1차 전달 데이터. 활용 가능하나 "변경될 수 있음" 상태 |
| 확정 데이터 | Confirmed Data | 데이터 입력팀 검수를 거쳐 99.9% 정확도가 보장된 최종 데이터 |
sequenceDiagram
actor 담당자
participant 스캐너_앱 as Sansan 스캐너·앱
participant AI as NineOCR
participant 입력팀 as 데이터 입력팀
participant DB as 전사 DB
담당자->>담당자: 상대방과 명함 교환
담당자->>스캐너_앱: 명함 스캔 또는 앱으로 촬영
스캐너_앱->>AI: 명함 이미지 전송
AI->>AI: 문자·섹션 자동 인식 (약 0.3초)
par 1차 전달 — 즉시
AI-->>DB: 임시 데이터 저장
DB-->>담당자: 임시 데이터 즉시 열람 가능
Note over 담당자: "변경될 수 있음" 상태로 표시
and 사람 검수 — 익영업일
AI->>입력팀: 인식 결과 전달
입력팀->>입력팀: 보안 분할 → 복수 독립 입력 → 자동 대조
입력팀->>DB: 확정 데이터 저장 (99.9% 정확도)
DB->>담당자: 데이터화 완료 알림
Note over DB: 임시 데이터가 확정 데이터로 교체됨
end
담당자->>DB: 연락처 검색·조회
Note over DB: 전 직원이 동일 DB에 접근 가능
담당자가 영업·미팅 등에서 상대방과 명함을 주고받는다. 이 시점이 Sansan 데이터 흐름의 기점이다.
담당자는 두 가지 방법 중 하나로 명함을 디지털화한다.
- 스캐너: Sansan 전용 하드웨어 스캐너를 사용. 명함 100장을 최대 5분에 처리하며, 명함에 손으로 적은 교환 날짜도 인식한다.
- 모바일 앱: 스마트폰 카메라로 명함을 촬영. 출장·외근 중에도 즉시 처리할 수 있다.
두 방법 모두 동일한 AI+사람 입력 파이프라인을 거쳐 정확도가 동등하다.
명함 이미지를 수신한 NineOCR(Transformer 기반 자체 OCR 엔진)이 이름·회사·부서·직함·전화번호·이메일·주소 등의 필드를 자동으로 인식하고 섹션을 구분한다. 이 과정은 약 0.3초 만에 완료된다. 인식이 완료되면 아래 두 경로가 동시에 진행된다.
NineOCR 인식 결과가 임시 데이터로 전사 DB에 즉시 저장되며, 담당자는 바로 열람할 수 있다. 이메일 수신자 설정, 연락처 다운로드 등 즉시 활용이 가능하다. 단, 해당 데이터는 "변경될 수 있음" 상태로 표시되며 정확도는 보장되지 않는다.
NineOCR 인식 결과를 데이터 입력팀이 검수한다. 구체적 절차는 다음과 같다.
- 보안 분할: 명함 이미지를 조각으로 분할하여 개별 오퍼레이터가 전체 명함을 볼 수 없도록 함
- 복수 독립 입력: 2명 이상의 오퍼레이터가 동일 조각을 독립적으로 입력
- 자동 대조: 입력 결과를 자동 비교하여, 불일치 시 3번째 오퍼레이터가 중재
- AI 후처리: 집계 후 딥러닝 모델이 잔여 오류 패턴을 추가 검출
이 이중 구조로 99.9%의 데이터 정확도를 달성한다.
검수가 완료된 확정 데이터가 전사 DB에 저장되며, 기존 임시 데이터를 대체한다. 연락처는 담당자 개인 소유가 아니라 조직의 자산으로 등록된다.
확정 데이터 저장이 완료되면 담당자에게 알림이 전송된다. 임시 데이터 단계에서는 별도 알림 없이 즉시 열람 가능하며, 이 알림은 사람 검수가 끝난 시점에 발송된다.
전 직원이 동일한 DB에 접근해 연락처를 검색할 수 있다. 자신이 교환하지 않은 명함도 열람 가능하여 "우리 회사 누가 이 사람을 알고 있는가"를 파악할 수 있다.
이 섹션은 "명함 스캔 후 이용자가 결과를 받아볼 때까지 소요되는 시간"에 대한 조사 결과를 정리한 것이다. (2026-02-25 작성)
Sansan은 즉시 제공되는 OCR 임시 데이터와 사람 검수를 거친 확정 데이터, 두 단계로 결과를 전달한다.
| 구분 | 소요 시간 | 정확도 | 비고 |
|---|---|---|---|
| OCR 임시 데이터 (1차 전달) | 약 0.3초 | OCR 수준 (보장 없음) | NineOCR 엔진에 의한 자동 인식 결과 |
| 확정 데이터 (최종 전달) | 익영업일 (20장/일/인 이하) | 99.9% | 데이터 입력팀 검수 완료 후 |
| 확정 데이터 (초과분) | 익영업일 이후 순차 처리 | 99.9% | 20장/일/인 초과 시 |
| 대량 일괄 위탁 | 2~3주 | 99.9% | 기존 보유 명함 일괄 디지털화 서비스 |
| 피크 시기 | 수 주 소요 가능 | 99.9% | 연말·연초 등 전사적 대량 스캔 시기 |
Sansan의 자체 OCR 엔진인 NineOCR은 Transformer 기반 모델로, 명함 이미지를 수신한 후 약 0.3초 만에 인식 결과를 생성한다. 이 결과는 "1차 전달(primary delivery)" 데이터로 즉시 사용자에게 노출된다.
- 이메일 수신자 설정, 연락처 다운로드 등 즉시 활용 가능
- 단, 해당 데이터는 "변경될 수 있음" 상태로 표시됨
- 사람 검수가 완료되면 확정 데이터로 자동 교체됨
즉, 수십 초 이내에 결과를 받아볼 수 있는 옵션은 존재한다. 다만 이는 OCR에 의한 임시 데이터이며, 99.9% 정확도가 보장되는 확정 데이터는 아니다.
엔터프라이즈 제품(Sansan)에서는 모든 명함이 반드시 데이터 입력팀의 검수 과정을 거친다. OCR 결과만으로 확정 데이터를 생성하는 옵션은 제공하지 않는다.
검수 과정의 구체적 절차:
- 보안 분할: 명함 이미지를 조각(fragment)으로 분할하여 개별 오퍼레이터가 전체 명함을 볼 수 없도록 함
- 복수 독립 입력: 2명 이상의 오퍼레이터가 동일 조각을 독립적으로 입력
- 자동 대조: 입력 결과를 자동 비교하여, 불일치 시 3번째 오퍼레이터가 중재
- AI 후처리: 집계 완료 후 딥러닝 모델이 잔여 오류 패턴을 추가 검출
이 시스템은 GEES(Global, Elastic, Efficiency, Scalable)라 불리며, 수천 명의 국내외 오퍼레이터가 참여한다.
| 조건 | SLA |
|---|---|
| 스캐너/앱으로 스캔, 20장/일/인 이하 | 익영업일 보증 (翌営業日保証) |
| 스캐너/앱으로 스캔, 20장/일/인 초과 | 랜덤 20장은 익영업일, 나머지는 순차 처리 (기한 미보증) |
| Eight 연동, Contact Inbox, 이메일 서명 가져오기 | SLA 적용 제외 |
| 대량 일괄 위탁 (기존 보유 명함) | 2~3주 |
명함 화면에서 예상 완료일을 확인할 수 있으며, 스캔 직후에는 "예측 중"으로 표시되다가 서버 도달 후 계산된 일자가 표시된다.
개인용 명함 관리 앱인 Eight은 2023년 기준으로 데이터화 과정을 완전 자동화하였다. NineOCR + 규칙/사전 기반 후처리만으로 데이터화를 완료하며, 사람 오퍼레이터가 개입하지 않는다. 이는 수동 입력으로 창업한 Sansan에게 의미 있는 전환점으로 평가된다.