카카오kanana #멀티모달ai #한국형ai모델 #음성감정인식 #ai공개모델1 카카오 AI의 기술 도약, ‘Kanana-o’로 멀티모달 시대 연다 Kanana-o란? 멀티모달의 결정판카카오가 공개한 Kanana-o는텍스트·음성·이미지를 동시에 이해하고 처리할 수 있는국내 최초의 멀티모달 언어모델입니다.텍스트 중심 AI의 한계를 뛰어넘음음성으로 묻고, 이미지 기반 응답이 가능한 대화형 AI감정, 억양, 방언까지 반영 가능한 고도화된 언어 이해 능력"이제는 AI가 ‘읽고, 듣고, 보고, 말하는’ 시대입니다."핵심 기술 – 모델 병합과 공동 학습 방식Kanana-o는 기존의 텍스트 모델에Kanana-v(비전)와 Kanana-a(오디오) 모델을 병합한 후공동 학습(joint training) 방식으로 최적화시킨 구조입니다.다양한 데이터 도메인을 하나의 맥락으로 처리멀티모달 간 정보 손실 없이 정확한 연산 가능스트리밍 합성 기술로 실시간 반응 속도 구현"이.. 2025. 5. 2. 이전 1 다음