구글 리서치는 AI를 사용해 손글씨를 읽는 새로운 방법을 선보임. InkSight 시스템은 중개 장치 없이 AI를 활용해 손으로 쓴 단어의 사진을 디지털 텍스트로 변환함.
이 아이디어는 때때로 오류가 발생하는 광학 문자 인식(OCR)을 대체하고, AI가 인간이 실제로 읽는 방법을 모방하도록 하는 것임. 이를 위해 연구자들은 AI에게 인간의 손글씨를 인식하고 모방하는 방법을 가르침.
"디지털 노트 작성이 인기를 얻고 있으며, 내구성이 뛰어나고 편집 가능하며 쉽게 색인화할 수 있는 방식으로 노트를 저장하는 방법인 디지털 잉크가 알려져 있음. 그러나 이 방식과 전통적인 펜과 종이 노트 작성 사이에는 여전히 상당한 격차가 존재함," 연구자들은 논문에서 설명함. "우리의 접근 방식은 읽기와 쓰기 우선 사항을 결합하여 대량의 쌍 샘플이 없는 상태에서 모델을 훈련할 수 있게 함. 우리가 아는 한, 이는 다양한 시각적 특성과 배경을 가진 임의의 사진에서 손글씨 텍스트를 효과적으로 변환하는 첫 번째 작업임."
InkSight는 단순한 대체 기술 이상임. 이상적인 상황이 아닐 때 더 정확한 결과를 제공함. 예를 들어, 사진이 어두운 조명에서 찍혔거나, 텍스트가 부분적으로 가려져 있거나, 혼란스러운 배경에서 OCR로 검사할 때 더 나은 성능을 보임. 연구자들은 사람들이 InkSight로 만든 텍스트의 87%를 읽을 수 있었고, 3분의 2는 실제 손글씨와 구별할 수 없을 정도로 좋았다고 밝힘.
손으로 쓰는 것을 좋아하는 사람들에게 InkSight는 몇 가지 잠재적인 이점을 제공함. 종이 노트북에 손으로 쓴 후, 카메라에 노트를 보여주면 즉시 검색 가능하고 이전 노트와 맥락에 맞게 정리할 수 있음. 특히 글씨가 지저분한 사람들에게 InkSight는 그들의 엉망인 글씨를 여전히 정확한 타이핑된 텍스트로 변환하는 데 도움을 줄 수 있음.
더 큰 규모에서, 이는 수세기 동안의 손글씨 텍스트를 디지털 형식으로 해독하고 변환하는 데 중요한 도구가 될 수 있음. 텍스트가 디지털 존재감이 적은 언어일지라도, InkSight는 손글씨를 보존하여 해당 언어의 훈련 자료를 구축하는 데 도움을 줄 수 있음.
구글만이 손글씨를 해독하는 AI 도구를 개발하고 있는 것은 아님. 예를 들어, 아마존의 새로운 킨들 스크라이브는 손으로 쓴 노트를 읽을 수 있는 기능을 업그레이드함. 또한 Goodnotes라는 디지털 노트 작성 앱도 손글씨를 읽을 수 있으며, 최근 Goodnotes Smart Ink 기술을 사용해 손글씨를 타이핑된 텍스트로 변환하는 편집 도구를 출시함. 추가된 도구는 손글씨 노트를 타이핑된 것처럼 편집할 수 있게 해주며, 노트를 정렬하고 복사 및 붙여넣기, 텍스트를 더 논리적으로 재배치하는 기능을 포함함.