시스템 엔지니어인 저자는 타이핑 피로를 줄이고 생산성을 향상시키기 위해 음성-텍스트 시스템을 개발했습니다. 그는 일일로 작업스테이션에서 명령어, 프롬프트, 노트 등을 타이핑하기 위해 수 시간을 보내며, 이는 신체적 불편을 유발하고 생각과 행동 사이에 병목 현상을 생성했습니다. 해결책은 안드로이드 앱이 로컬 와이파이를 통해 워크스테이션의 파이썬 서비스로 인식된 음성을 전송하고, 그 서비스가 커서의 위치에 텍스트를 입력하는 것입니다.
중요한 통찰은 안드로이드의 내장 음성 인식이 Whisper 또는 Vosk와 같은 다른 솔루션보다 우수한 성능을 보인다는 것입니다. 안드로이드의 네이티브 음성-텍스트는 빠르고 정확하며, 장치 하드웨어에서 실행되며 언어 전환을 무결하게 처리합니다. 이 시스템은 생산성을 크게 향상시켜, 프롬프트, 커밋 메시지, 문서화와 같은 작업의 속도를 3배로 증가시켰습니다.
생산성 이외에도, 이 도구는 그의 신체적 건강을 크게 개선하여, 전통적인 타이핑과는 달리 일일 반나절 동안 서서 일할 수 있게 되었습니다. 안드로이드 앱은 Kotlin과 SpeechRecognizer API를 사용하며, 워크스테이션 서비스는 키보드 입력 시뮬레이션을 위해 xdotool을 사용하는 가벼운 파이썬 스크립트입니다. 시스템은 완전히 로컬로 작동하여, 데이터 개인 정보 보호와 낮은 지연 시간을 보장하며, 인터넷 의존성이 없습니다.
일반적인 텍스트 입력에는 탁월하지만, 변수 이름 및 구문으로 인해 코딩에는 잘 작동하지 않으며, 시끄러운 환경이나 고급 기술 용어에도 적합하지 않습니다. 그러나 Claude Code와 같은 AI 도구를 사용하면, 저자는 수동으로 코드를 입력할 필요가 줄어들었습니다. 이 자체 개발 도구는 개발에 단 2일의 시간만을 들여, 일일 작업에서 마찰을 제거하고 효율성과 신체 건강을 모두 개선하는 것으로 입증되었습니다.
dev.to
How LLM Can Fix Your Posture
