• 북마크
V2R타임즈

IT

미디어젠-ETRI, RGB 3채널 이용한 컬러 음성 스펙트럼 개발

2023.03
08

본문

142581885fd0eb0acf4fa2d44e3675c6_1678284927_9963.jpg
 

코스닥 상장사 미디어젠(279600, 대표 고훈)은 한국전자통신연구원(ETRI)의 연구 인력 현장 지원 프로그램을 통해 기존에 음성 스펙트럼 채널이 1개인 것을 보완해 RGB 3채널을 이용한 음성 스펙트럼을 개발했다고 밝혔다.


E2E 시대를 맞아 눈부신 성능 향상을 이루며 인식 성능 면에서 정점에 오른 심층 학습망 기반의 음성 인식 시스템은 트랜스포머 알고리즘에 기반을 두고 있다. 트랜스포머 알고리즘은 많은 양의 학습 데이터를 소화하며 그 성능을 향상해 왔다. 그러나 초거대 용량의 학습 데이터 출현으로 그 성능 향상 정도는 어느 정도 포화 상태에 이른 상황이다. 이런 상황에서 음성 인식 성능을 높이기 위해 음성 인식 특징을 추출하는 새로운 방법을 모색하는 등 네트워크 아키텍처뿐만 아니라 다양한 기술 분야의 연구가 요구되고 있다.


현재 가장 널리 사용되는 음성 인식 특징은 ‘로그 멜 스펙트럼’이지만, 이 특징은 음성 신호의 다양한 생성 과정을 포함하지 못한다는 단점이 있다. 또 심층 학습망의 특성상 입력이 되는 특징이 다양한 음성의 특징적 요소를 각각 표현해줄 수 있어야 이를 바탕으로 더 지능적인 학습을 진행할 수 있다.


이에 따라 미디어젠은 ETRI 연구 인력 현장 지원 프로그램을 통해 음성 발성 모델을 활용, 분석된 성도 필터 정보와 신호 정보를 채널화함으로써 RGB 구성 요소를 갖는 컬러 스펙트럼을 개발했다. 일반적으로 성도 필터 정보는 음소를 표현하기에 적합하며 배경 잡음에 상대적으로 강인한 특성이 있고, 신호 정보는 음성 정보뿐만 아니라 발성 개인의 특성을 잘 표현해주는 특성이 있다. 컬러 스펙트럼에서는 이런 정보를 분석한 뒤 특징화해 음성 인식 시스템을 학습할 때 이를 심층 학습망에 알려줌으로써 인공지능이 음성 인식에 필요한 특징 정보를 선택하도록 도움을 준다. 이를 증명하기 위해 수행된 텐서플로(Tensorflow) 기반 딥스피치2(DeepSpeech2) 음성 인식 시스템 실험에서 기존 로그 멜 스펙트럼 음성인식 시스템보다 20% 이상의 ERR 성능 향상이 나타나는 것을 확인했다.


미디어젠 송민규 상무는 “ETRI 연구 인력 현장 지원 프로그램을 통해 개발된 컬러 스펙트럼은 음성 인식뿐만 아니라 TTS, 화자 분리, 감정 인식 등 음성 기반의 모든 분야 및 오디오 관련 응용 분야 등 활용 범위가 매우 넓다”며 “음성 인식 성능 향상의 경우, 이미지 처리를 위해 개발된 다양한 네트워크 아키텍처들을 채용해 더 다양하고 효율적인 음성 인식 시스템 구성이 가능할 것으로 기대된다”고 말했다.


미디어젠 소개


미디어젠은 음성 솔루션의 시작과 끝을 책임지는 기업으로 음성 인식 시스템 및 인공지능(AI) 음성 신기술 개발 등 한발 더 앞선 기술을 제공한다.


웹사이트: http://www.mediazen.co.kr/

댓글목록 0

등록된 댓글이 없습니다.
전체 914 건 - 1 페이지
2023.07
14

제이씨현시스템㈜, 80+ BRONZE 인증의 가성비를 갖춘 TUNDRA 리부트 파워서플라이 2종 출시!

 제이씨현시스템㈜, 80+ BRONZE 효율의 가성비 파워TUNDRA 리부트 500W & 600W FHB 80+ BRONZE 출시!국내 최고 수준의 서비스를 제공하는 제이씨현시스템㈜ (대표: 차중석)에서는 2023년 7월, 새롭게 다시…

VR타임즈 15시 24분 408
2023.05
02

브라보텍, 탁월한 성능·LCD 디스플레이 탑재 NZXT KRAKEN 시리즈 수랭 쿨러·CORE RGB 팬 쿨러 출시

PC 케이스, 쿨링 시스템, 파워 서플라이, 입력장치 및 주변기기 전문 업체 브라보텍이 자사 내 최상위 쿨링 퍼포먼스에 전 모델 LCD 디스플레이 탑재, 신형 F시리즈 RGB CORE 시리즈 팬 쿨러로 더욱 향상된 성능과 튜닝 퍼포먼스를 갖춘 NZXT…

VR타임즈 00시 11분 297
2023.05
02

인피니언, AIROC™ CYW43022 Wi-Fi 5 및 Bluetooth® 콤보 제품 출시

인피니언 테크놀로지스(코리아 대표이사 이승수)는 새로운 AIROC™ CYW43022 초저전력 듀얼 밴드 와이파이 5(Wi-Fi 5) 및 블루투스(Bluetooth®) 콤보 제품을 출시한다고 밝혔다.CYW43022의 초저전력 아키텍처는 업계 최고의 성능…

VR타임즈 00시 09분 396
2023.05
02

파수, FDI 2023에서 AI 시대의 보안 및 데이터 관리 전략 제시

 주식회사 파수(대표 조규곤, 이하 파수)가 19일 연례 고객 행사인 ‘파수 디지털 인텔리전스 2023(Fasoo Digital Intelligence 2023, 이하 FDI 2023)’을 성공적으로 마쳤다. 다양한 기업 및 기관의 CIO, …

VR타임즈 00시 08분 456
2023.05
02

스마트 모듈러 테크놀로지스, 새로운 PCIe NVMe SSD 출시

 SGH(나스닥: SGH)의 사업부이자 메모리 솔루션, 솔리드 스테이트 드라이브 및 하이브리드 스토리지 제품의 글로벌 리더인 SMART 모듈러 테크놀로지스(SMART Modular Technologies, Inc.)(‘SMART’)는 스마트 …

VR타임즈 00시 07분 285
2023.05
01

로퍼미닷컴, 기초 법률상담 챗봇 ‘AI변호사’ 베타버전 공개

 법무법인 예율이 기초 법률상담을 무료로 받아볼 수 있는 인공지능(AI) 챗봇 ‘AI변호사’의 베타서비스를 시작했다고 20일 밝혔다.이번에 공개된 AI번호사는 법무법인 예율이 개발한 기초 법률상담 챗봇으로, 복잡한 법률 지식에 접근하기 어려운…

VR타임즈 23시 37분 269
2023.05
01

카카오톡 기반 쇼핑몰 CS 챗봇 챗봇나우, 고객사 CS 문의량 30% 이상 줄여

챗봇나우는 고객사 ‘하시(HACIE)’가 2월 ‘챗봇나우’를 도입한 이후, CS 문의량이 30% 이상 감소하고 업무 효율이 높아졌다고 밝혔다. 챗봇나우는 케이앤웍스와 디케이테크인이 공동 개발한 카카오톡 기반 쇼핑몰 CS 챗봇이다.하시(HACIE)는 2…

VR타임즈 23시 36분 324
2023.05
01

띵션, AI 프롬프트 거래 위한 프롬프트 마켓 ‘프롬프트 스페이스’ 베타 서비스 출시

 웹/앱 개발 전문 스타트업 띵션(Thinction)은 19일 인공지능(AI) 프롬프트 거래를 위한 온라인 프롬프트 마켓 ‘프롬프트 스페이스’ 베타 서비스를 공식 출시한다고 밝혔다.프롬프트 스페이스는 다양한 판매자들이 자신의 프롬프트를 등록하…

VR타임즈 23시 35분 318
2023.05
01

마우저, 다중 채널 및 고속 데이터 통신 확장한 유블럭스의 JODY-W3 호스트 기반 차량용 모듈 제품 제공

 가장 다양한 반도체 및 전자부품을 공급하며 업계를 선도하는 신제품 소개(NPI) 유통 기업™이자 혁신을 구현하는 신제품 소개(NPI) 선도 기업 마우저 일렉트로닉스는 유블럭스(u-blox)의 JODY-W3 호스트 기반 차량용 모듈을 공급한다…

VR타임즈 23시 34분 335
2023.04
28

프라이머, 국내 최초 생성 AI 해커톤 제1회 ‘Gen AI 해커톤’ 성료

 스타트업 액셀러레이터 프라이머(대표이사 권도균)가 국내 최초로 개최한 제1회 ‘젠에이아이 해커톤(Gen AI Hackathon)’이 성황리에 대단원의 막을 내렸다.젠에이아이 해커톤은 생성형 인공지능(Generative AI) 분야 개발 대회…

VR타임즈 00시 05분 342
2023.04
28

SK텔레콤, 월드 IT쇼 2023 참가해 다양한 혁신 기술·서비스 전시

 SK텔레콤(대표이사 사장 유영상)이 19일부터 서울 코엑스(COEX)에서 개막하는 국내 최대 ICT 전시회 ‘월드 IT쇼 2023(WIS 2023)’에서 AI, UAM, 메타버스 등 자사의 다양한 첨단 ICT 기술과 서비스를 선보인다.SKT…

VR타임즈 00시 04분 497
2023.04
28

알서포트, 엘케이벤쳐스의 ‘인생네컷’에 원격제어 솔루션 공급

 글로벌 비대면·원격 솔루션 전문기업 알서포트(대표 서형수)가 자사 원격제어 솔루션 ‘리모트뷰(RemoteView)’를 엘케이벤쳐스의 셀프사진인화 스튜디오 ’인생네컷'에 공급했다고 19일 밝혔다.엘케이벤쳐스는 무인 사진촬영 기기·키오스크 제조…

VR타임즈 00시 02분 290
2023.04
28

일가자, 국내 최초 인공지능 기술 적용 일용직 인력 추천 배정 서비스 ‘일가자 A.I’ 출시

 비대면 일용직 중개 플랫폼 ‘일가자’는 인공지능 기술을 활용한 작업-인력 맞춤 추천 배정 서비스를 출시했다고 19일 밝혔다.이번 인공지능 기반 인력 추천 서비스는 2년간 TIPS 과제로 개발한 ‘A.I 기반 맞춤형 비대면 현장 인력 실시간 …

VR타임즈 00시 01분 282
2023.04
27

TWC 클라우드게이트, 고객 상담에 챗GPT를 접목해 더 스마트한 AI 상담 구현

인공지능(AI) 기반의 통합 상담 솔루션을 제공하는 더화이트커뮤니케이션(대표 박민영, 이하 TWC)이 자체 AI 엔진에 챗GPT를 접목한 기술 고도화를 진행했다고 밝혔다.TWC는 클라우드 기반으로 원하는 상담 채널을 연동해 어디서든 연속성 있는 상담이…

VR타임즈 23시 59분 260
2023.04
27

씨게이트, 동급 최고의 신뢰성과 성능 갖춘 ‘아이언울프 프로’ 22TB HDD 출시

 데이터 스토리지 인프라 솔루션 분야의 세계적 선도업체 씨게이트(Seagate Technology Holdings plc)가 미국 라스베이거스에서 열린 NAB 2023 콘퍼런스에서 ‘아이언울프 프로(IronWolf Pro)’ 22TB HDD를…

VR타임즈 23시 58분 355