Skip to main content

번역전문회사 플리토

#


#

동사는 2012년 8월 설립되었으며, 집단지성 플랫폼을 통해 수집된 언어 데이터를 검수 및 정제 후 판매하는 사업을 영위.

언어 데이터를 AI스피커, 전자상거래 등 다양한 산업군으로 구성된 글로벌 언어데이터 수요 기업에 판매하며, 2014년부터 정부기관과의 협업을 통해 공공 데이터 구축 사업을 진행중.

현제까지 적용되지 않았던 번역의 디지털 트랜스포메이션으로 언어와 관련된 종합적인 서비스 제공을 목표로 플랫폼을 개발하고 있음.




II. 사업의 내용


1. 사업의 개요

가. 산업의 특성

인공지능은 컴퓨터가 여러 데이터를 이용하여 학습한 내용을 기반으로 새로운 데이터에 대한 적절한 작업 및 예측 등을 수행할 수 있도록 하는 알고리즘과 기술을 말합니다. 인공지능 기술 분류는 다음과 같습니다.

이미지: 인공지능 기술분류

인공지능 기술분류

※     출처 : 2017 데이터산업백서, 한국데이터진흥원

 

인공지능은 예측, 추론, 인식, 탐지 등 지능형 결과를 출력함에 따라 특정 산업의 제한없이 다양한 서비스를 가능하게 합니다. 특히나 앞으로 데이터의 기하급수적인 증가와 강력해지는 컴퓨팅 파워를 통해 폭발적인 가치를 지닌 산업으로 더욱더 성장하게 될 분야입니다.


(1) 언어데이터 관련 시장의 개요

언어데이터의 시장은 인공지능의 기술 발전에 따라 확대 및 발전하였습니다. 1950년대부터 인공지능 기술은 개념과 구현에 대한 논의와 함께 발전이 시작되었습니다. 이후 산업 및 학계 내에서 지속적으로 인공지능 관련 기술과 성능이 향상되어 왔으나, 컴퓨팅 파워의 한계, 학습에 필요한 데이터의 제한, 알고리즘의 한계 등으로 발전의 속도가 점차 느려지게 되었습니다. 하지만 최근 신경망을 활용한 Deep Learning 기술의 등장으로 인공지능 발전의 제약요인들이 해소되면서, 인공지능 기술과 관련산업은 다시 빠르게 성장하고 있으며 이에 따라 언어데이터 시장 또한 확대되고 있습니다.

최근 인공지능은 빅데이터, 로봇공학, 양자암호, 사물 인터넷, 무인 운송, 3D 프린팅,연결 표시 기술 등과 결합하여 4차 산업 혁명의 요소 기술로 평가받고 있습니다. 다양한 산업 내에서 빠르게 성장하는 인공지능은 기계번역기, AI스피커 등 언어데이터를 활용하며 특히 우리 실생활에서 두각을 나타내기 시작했습니다. 자연어 처리, 음성인식, 이미지 인식, 음성 합성 등 언어 관련 기술과 더불어 정제된 빅데이터의 투입으로 인하여 인공지능 성능은 급격히 성장하고 있으며, 이에 다수의 기업들이 언어 분야의 인공지능 개발 및 성능향상을 위한 경쟁에 돌입하고 있습니다. 대표적인 기업으로 구글(미국), 애플(미국), 아마존(미국), 바이두(중국), 텐센트(중국), 네이버(한국),카카오(한국) 등이 있으며, 향후 더 많은 기업들의 경쟁을 통해 인공지능 시장은 더욱빠르게 성장할 것으로 기대됩니다.


(가) 지역별 인공지능 시장 규모 및 전망
해외 리서치 전문기관인 트랙티카(Tractica)에 따르면, 글로벌 인공지능 시장 규모는2015년 2억달러에서 2024년 111억달러로 약 55배 성장할 것으로 전망되고 있습니다. 특히 2024년에는 우리나라를 포함하여 일본, 중국, 인도 등이 속한 아시아/태평양 지역의 시장 규모가 가장 큰 비중을 차지할 것으로 전망되고 있습니다.


  (단위 : 백만 USD)
이미지: 2015-2024 지역별 ai 시장 규모와 전망

2015-2024 지역별 ai 시장 규모와 전망

주) 출처 : Tractica

국내 데이터산업 시장 규모는 2018년 15조 5,684억원으로 2017년 대비 8.5% 성장했으며, 2019년은 16조 8,693억원으로 추정됩니다.

(단위: 억원)
구분2016년2017년2018년2019년(E)증감율CAGR
'17~'18'17~'19
데이터솔루션15,72016,45718,61720,40913.13%7%
데이터구축/컨설팅55,85058,89461,29064,9224.07%3%
데이터서비스65,97768,17975,77883,36111.15%7%
합계137,547143,530155,685168,6928.47%6%

주) 출처 : 과학기술정보통신부, 한국데이터산업진흥원 '2019년 데이터산업현황조사주요 결과 요약'

이 중 데이터산업 직접매출 시장 규모는 2018년 8조 5,728억 원으로 2017년 대비   30.6% 성장했으며, 2019년은 9조 2,094억 원으로 추정됩니다. 

(단위: 억원)
구분2017년2018년2019년(E)증감율CAGR
'17~'18'17~'19
데이터솔루션16,45718,61720,40913.13%7%
데이터구축/컨설팅30,84737,00938,97119.98%8%
데이터서비스18,33930,10232,71464.14%21%
합계65,64385,72892,09430.60%12%

* 직접매출: 전체 데이터 매출에서 데이터 관련 간접매출(광고매출, 시스템 운영관리 매출)을 제외한 매출입니다.
주) 출처 : 과학기술정보통신부, 한국데이터산업진흥원 '2019년 데이터산업현황조사주요 결과 요약'

(나) 산업별 인공지능 시장 규모 및 전망
각 산업 분야별로 보면 특히 정보통신(Telecommunications), 소비재(Consumer), 광고(Advertising), 기업 용역(Business Services), 의료(Healthcare) 등의 영역에서 인공지능 기술이 향후로도 많이 활용될 것으로 예측되고 있습니다.


  (단위 : 백만 USD)
이미지: 2017 - 2025 산업별 ai 시장규모 전망

2017 - 2025 산업별 ai 시장규모 전망

주) 출처 : Tractica

2016년 인공지능 시스템 분야에 가장 많은 투자가 진행된 산업은 금융과 소매산업이며, 헬스케어와 조립/제조 산업 또한 많은 투자가 진행되고 있습니다. 이러한 투자를 바탕으로 금융과 소매산업 관련 인공지능 시장규모는 2016년 각각 15억달러에 달하며, 헬스케어와 조립/제조 산업 관련 인공지능 시장규모는 2016년부터 2020년까지 각각 연평균 69.3%, 61.4%에 이르는 성장률을 보일 것으로 기대됩니다.

또한 인공지능 애플리케이션 분야가 큰 규모로 빠르게 성장하여 해당 시장규모가 2020년 182억 달러에 달할 것으로 전망됩니다. 이외에도 서버와 스토리지를 구축하는 하드웨어 부문 역시 2016년부터 2020년까지 5년 동안 연평균 60% 이상의 성장률이예상되고 있습니다.


(2) 음성인식(Voice Recognition) 시장
음성인식 기술은 컴퓨터가 마이크와 같은 소리 센서를 통해 얻은 음향학적 신호를 단어나 문장으로 변환시키는 기술을 말합니다. 스마트폰이 등장하고 여기에 음성인식 기술이 적용되기 시작하면서 음성인식 기술이 빠르게 대중화되기 시작하였습니다. 스마트폰은 그 자체로도 방대한 데이터를 충분히 처리할 수 있는 프로세서이며, 탑재된 마이크를 통해 음성인식 기술 적용에 최적화된 장치였기 때문입니다.

초기에는 단순한 명령 정도만 알아듣는 음성 비서로 시작했던 음성인식 기술은 이후 더욱 다양한 분야에 적용되면서 빠르게 발전하고 있습니다. 최근에는 음성인식을 전면에 내세운 AI스피커가 등장했으며, 다양한 스마트 가전기기에 음성인식 기능이 적용되고 있습니다. 향후 가전뿐만 아니라 음성인식이 적용된 스마트 차량도 조만간 상용화되어 출시되는 등, 음성인식 기술은 실제 소비자의 일상에 밀접하게 이용될 것으로 기대됩니다.


(가) 음성인식 시장의 확대
말 한마디로 날씨 예보는 물론 좋아하는 음악, 사고 싶은 물건에 대한 쇼핑 정보를 알아낼 수 있을 정도로 음성인식 기술은 이미 우리 생활에 깊이 스며들어 일상 속에서 널리 사용되고 있으며, 인공지능 기술과 사물인터넷(IoT) 기술의 본격적인 확산과 맞물려 다양한 분야로 점차 확대될 전망입니다. 향후 스마트카, 스마트홈 등 가까운 우리의 주변은 물론, 의사 소견을 알아듣고 데이터를 처리하는 AI병원, 음성만으로 주문을 처리하는 AI마트 등 다양한 산업까지 우리 일상내 모든 접점에서 음성인식 기술이 접목된 인공지능의 사용 범위가 넓어질 전망입니다. 이와 같이 음성인식 기술은 인공지능의 시대에 모든 제품의 기반 기술로 스며들고 있습니다.

2015 년 세계 음성 인식기술 시장 규모는 약 6억달러였으나, 2016 년에서 2024 년까지 연평균 26.99 % 성장하여 2024년 세계 음성 인식기술 시장 규모가 약 71억 달러까지 증가할 것으로 예상되고 있습니다. 음성인식 시장의 인기가 높아짐에 따라 관련업계 또한 높은 성장세를 보일 것으로 예상됩니다.


  (단위 : 백만 USD)
이미지: 2015 - 2024 음성인식기술 시장 규모

2015 - 2024 음성인식기술 시장 규모

주) 출처 : Tractica

음성은 지문이나 홍채와 같은 개인의 고유한 특성이므로 음성 자체를 활용하여 하나의 인증 수단으로 기능하려는 추세입니다. 온라인 거래의 선호되는 인증 방법으로서 음성을 구분하는 것은 매우 정확한 원격 인증 제공이 가능합니다. 또한 차량을 운전하는 동안 휴대전화 사용을 규제하는 핸즈프리(hands-free) 규정을 더 많은 국가에서시작함에 따라 자동차에 음성 인식 시스템을 통합하는 기술은 세계적인 인기를 얻고 있습니다. 이처럼 글로벌 음성 인식 시장은 기술 발전과 고급 전자장치의 사용 증가로 인해 향후 음성인식기술 시장 또한 지속적으로 성장할 것으로 예상됩니다.

(나) 음성인식 기술의 확장과 음성데이터의 수요 증가
음성 인식 기술은 스마트폰, 태블릿, 랩탑 및 이와 연결된 장치 등과 같이 소비자의 전자장치에 광범위하게 사용됩니다. 특히 Internet of Things (IoT) 장치에 대한 수요증가는 소비자 수직 계열의 음성 인식에 대한 요구를 더욱 증폭시키고 있으며, 이와 직간접적으로 관련된 산업 또한 빠르게 성장할 것으로 예상됩니다. 예를 들어 음성 인식 소프트웨어는 기업 및 소비자에게 모바일 및 데스크톱 음성 인식 솔루션을 제공하여 사용자에게 효율적인 문서 작성을 가능하게 하거나, 간단한 음성 명령을 통해 이메일을 작성하여 보낼 수 있도록 하는 등 다양한 방면에서 활용이 가능합니다. 또한 정부 기관에서는 음성 인식 기술을 활용하여 전화를 기반으로 한 맞춤형 고객 서비스 솔루션 제공이 가능하며, 이를 통해 예산 제약하에서도  시민 편의 및 만족도 증가 등의 효과를 기대할 수 있습니다.

이처럼 음성인식 기술의 활용도가 증가함에 따라 음성 인식 시장의 주요 기업들은 경쟁 우위를 차지하기 위해 음성 인식의 정확도를 높이는 데 주력하고 있습니다. 독자적인 개발 외에도 타 기업과 전략적 제휴 및 인수합병 등을 통해 각기 보유한 기술력을 강화해 나가고 있습니다. 음성인식 기술 업계에서는 향후 자연어 처리(NLP)를 위해 ① 빅데이터 기반의 코퍼스 수집과 머신러닝을 이용한 번역품질 개선, ② 자연어 대화형 서비스의 출현과 음성인식 정확도 개선을 위한 자동음성인식(ASR) 기술의 진보, ③ 자연어 처리(NLP) 공개 플랫폼을 통한 생태계 구성과 ④ 이를 둘러싼 글로벌 플랫폼 사업자간 경쟁 심화 등 네가지 트렌드에 맞춰 발전할 것으로 전망됩니다.

(3) 이미지인식(Image Recognition) 시장
글로벌 이미지 인식 시장 규모는 2015 년 약 12억달러였으나, 2016 년부터 2025 년까지 연평균 19.2 % 성장할 것으로 예상됩니다. 기술의 발달에 따라 누구나 어디서든 쉽고 빠르게 인터넷에 접속하는 환경이 조성되었고, 각종 소셜 미디어와 웹 서비스가증가함에 따라 이미지인식 기술에 대한 수요는 증가할 것으로 예상됩니다.


  (단위 : 백만 USD)
이미지: 2014 - 2025 이미지인식기술 시장 규모

2014 - 2025 이미지인식기술 시장 규모

주) 출처 : Tractica

전통적으로 금융권(BFSI - Banking, Financial services and Insurance)내에서 고객정보 활용을 위해 높은 대역폭의 데이터 서비스와 고급 기계 학습에 대한 선호도가 높게 나타납니다. 이로 인해 이미지인식 기술을 다양하게 활용하여 고객 만족을 위한서비스 개발로 이어졌습니다. 이후 이미지 인식 기술 자체가 급격히 발전하는 한편 다양한 산업 내에서 이미지를 활용한 서비스가 등장하면서 점차 일반 사용자들의 이미지 인식 기술 활용도가 높아지고 있습니다. 예를 들어 각 사용자가 보유한 스마트폰을 통해 유통매장 내 브로셔 및 잡지의 이미지를 읽어들이면, 곧바로 관련 제품 정보와 함께 오프라인 콘텐츠 서비스까지 제공할 수 있는 수준에 이르렀으며, 증강 현실 경험까지도 제공가능합니다.

기본적으로 이미지 데이터 분석을 통해 이미지의 활용이 증가하면서, 이미지 형태의 데이터 수요 또한 급증하고 있습니다. 실제로 이미지 데이터 분석을 진행중인 업체들은 사람과 물체를 식별하고, 이미지 내 정보를 이해하는 기술을 개발하고 있어 향후로도 관련 시장은 더욱 성장할 것으로 기대됩니다. 


(4) 플랫폼 내 언어서비스 시장의 개요
최근 번역 등 언어서비스 시장에서 특히 주목할 만한 점은 사람이 직접 언어서비스를제공하는 전통적인 방식뿐만 아니라 기계를 통한 언어서비스 시장 규모 또한 함께 성장하고 있다는 점입니다. 일반적으로 번역가를 통한 사람의 번역과 기계번역은 서로 대체재의 성격을 띠고 있어 상호 공존이 어려운 것으로 생각되고 있습니다. 물론 한정된 시장 수요를 전제로 한다면 사람의 번역과 기계번역은 일정부분 대체의 효과가 존재할 수 있으나, 빠른 세계화로 인해 전자상거래, 여행, 복지 등 다양한 산업 내 번역의 수요가 크게 증가하고 있어 사람의 번역과 기계번역은 각각의 시장규모가 함께 성장하고 있는 모습을 보여주고 있습니다. 특히, 일상적인 주제에 대한 대량 번역은 기계번역의 시장으로 분화되고, 전문적이고 특수한 번역은 사람의 번역으로 분화되는 등 번역 시장의 특성에 따라 가장 효율적이고 효과적인 방법에 따라 기계번역과사람의 번역이 상호 보완 관계를 보이고 있습니다.

(가) 전체 언어서비스 규모 및 전망
시장 조사 전문 기관인 Statista에 따르면, 글로벌 번역시장 규모는 2021년 약 562억달러로 2009년 235억달러 대비 1.5배 이상 성장할 것으로 예측하고 있습니다. 특히 각종 산업의 세계화가 진행되면서 글로벌 번역시장은 매년 빠른 증가세를 보일 것으로 예상되고 있습니다.


  (단위 : 십억 USD)
이미지: 2009 - 2021 번역시장 규모

2009 - 2021 번역시장 규모

주) 출처 : Statista

(나) 기계 언어서비스 규모 및 전망
글로벌 기계번역시장 규모는 2016년 4억달러였으나, 이후 연평균 14.6 % 성장하여 2024년 15억달러에 도달할 것으로 예상되고 있습니다. 특히 인터넷 보급률이 증가하고 운영 비용을 절감해야 할 필요성이 커지면서 향후 글로벌 기계번역시장의 성장은 가속화될 것으로 예상되며, 스마트폰 보급이 급증하고 통신 인프라가 개선되면서 산업 성장에도 긍정적인 영향을 미치고 있습니다. 향후 신경망 기계번역(Neural Machine Translation, NMT)의 성장과 함께 기계번역시장의 범위가 더욱 확장될 것으로 기대됩니다.


  (단위 : 백만 USD)
이미지: 2016 - 2024 기계번역시장 규모

2016 - 2024 기계번역시장 규모

주) 출처 : Statista

전통적인 번역 업계를 선도하는 글로벌 번역업체인 LSP(Language Service Provider)들은 기계번역 시장이 급성장함에 따라 위기감을 느끼게 되었습니다. 이에 LSP는 기계번역기와의 공생을 선언하였으며, 이러한 수정된 전략하에 LSP는 B2B 시장을 목표로 자체 기계번역기 개발을 본격화하였습니다. 실제로 SDL Plc, Lionbridge 등 대형 LSP들은 수년간 자체적으로 축적해온 TM(Translation Memory)를 기반으로 기계번역기 개발을 시작하였으며, 기존의 번역 고객에 특화된 기계번역기를 제공하고 있습니다.

(다) 시장의 주요 특징

① 팀 단위의 번역 발주
조직의 규모가 증가함에 따라 기업의 번역 수요는 증가하게 됩니다. 제품 및 서비스 전체의 현지화 작업 뿐만 아니라, 팀 내의 의사소통, 업무 등 작지만 다양한 부분까지도 번역이 필요하게 됩니다. 이에 비교적 규모가 있는  기업에서는 전사계약이 아닌 팀 단위로 번역 중개업체에 용역을 발주하는 것이 일반적입니다. 하지만 동일 기업 내의 각 팀별로 번역 중개업체와 체결하는 용역 계약은 기업과 번역 중개업체 모두의비효율을 초래하게 됩니다.

② 최종 공정으로서 짧은 일정
번역은 통상적으로 현지화의 최종 단계로서, 모든 제품 및 서비스의 완료단계 이후에최종적으로 진행됩니다. 이로 인하여 대부분의 번역은 데드라인을 맞추기 위하여 급박한 일정속에서 진행되며, 이는 많은 번역 중개업체가 겪는 어려움입니다. 이러한 어려움을 해결하기 위해서는 당사와 같이 다양한 번역가들을 플랫폼을 통해 보유하는 한편, 이를 데이터화 하여 정밀하게 관리하여 짧은 시간 안에 높은 수준의 결과물을 전달하는 것이 필요합니다.

③ 정보 비대칭성에 기반한 시장
당사를 제외하고 현재 번역 시장에서는 공급자와 수요자를 만족시키는 플랫폼이 형성되어 있지 않습니다. 이로 인하여 번역 중개업체 중심의 시장이 형성되어 있으며, 정보의 비대칭성으로 인하여 번역 수요자인 기업들의 신뢰를 잃는 사례가 자주 발생하고 있습니다. 무엇보다 용역수행자인 전문번역가에 대한 검증이 체계적이지 않기 때문에 많은 기업들은 번역 중개업체에 대한 신뢰가 낮은 상황입니다.


(라) 목표시장
당사는 플랫폼을 통해 언어와 관련한 종합적인 서비스 제공을 목표로 하고 있습니다.언어와 관련한 대표서비스인 번역은 현재까지 디지털 트랜스포메이션(Digital Transformation: 디지털 기술을 사회 전반에 적용하여 전통적인 사회 구조를 혁신 시키는 것)이 이루어지지 않은 대표적인 산업군으로서, 타 산업군에 비해 보수적인 특성에 따라 전통적인 소규모 중개업체 중심의 영업 환경을 이루고 있습니다. 보수적인 특성을 지닌 번역시장을 포함하여 언어로부터 발생가능한 모든 문제를 가장 효율적인 방법으로 해결하고자 플랫폼을 활용하고 있으며, 이를 통해 시간 및 장소의 한계 없이 다양한 참여자들의 만족도를 높이는 것이 당사의 목표입니다.

이미지: 플랫폼 내 언어서비스 개요

플랫폼 내 언어서비스 개요



(5) 대체 시장의 존재 여부 및 향후 전망

최근 기계 번역기 내 적용기술이 SMT(Statistical Machine Translation)에서 NMT(Neural Machine Translation)으로 변경되면서 기존 대비 기계번역기의 번역 품질이 크게 향상되었습니다. SMT 방식과는 달리 NMT는 인공지능의 학습을 통해 스스로 번역에 대한 규칙을 만들게 됩니다. 이러한 인공지능 학습을 위해서는 정제된 언어데이터가 끊임없이 투입되어야 하며, 이에 주요 IT 기업들은 개발중인 인공지능의 성능향상을 위해 문어체 문장, 구어체 문장 등 다양한 조건과 상황의 텍스트 데이터(병렬 Corpus)를 필요로 합니다.

또한 AI스피커의 상용화에 따라 음성데이터 또한 수요가 증가하고 있습니다. AI스피커가 사람이 하는 말을 듣고 이해하는 것을 시작으로, 주어진 명령에 따라 음악을 틀거나 날씨를 알려주는 등의 여러가지 작업이 가능해야 합니다. 이때 사람의 음성은 성별, 연령, 억양, 국적 등에 따라 미묘하게 다르기 때문에 이를 AI스피커가 인식할 수있도록 충분한 학습이 이루어져야 하며, 이를 위한 음성 데이터가 요구됩니다. 향후 AI 스피커는 각 가정 내 모든 전자기기 등을 IoT (Internet Of Things)방식으로 연결하는 중요한 역할을 할 것으로 전망되기 때문에, AI스피커의 개발 및 고도화를 위한 음성 데이터 수요 또한 증가할 것으로 기대됩니다.

위와 같은 기계번역기와 AI스피커의 사례에서와 같이 향후로도 고품질의 언어데이터수요가 급증할 것으로 예상됩니다. 다만 해당 언어데이터의 수요에 따라 이를 공급하는 업체는 대부분 소규모 번역 업체 내에서 전문가를 통한 작업이 한정적으로 이루어지고 있는 상황입니다. 전문가를 통한 데이터 생산방식은 플랫폼 내에서 집단지성을 통한 데이터 생산을 진행하는 당사의 방식과 일부 유사할 수 있으나, 비용, 속도, 종류, 품질 등에서 큰 차이를 보이고 있습니다. 전문가를 통한 방식대비 다양한 언어데이터를 저렴하고 빠르게 수집하는 당사의 방식은 고객사에 더욱 적합한 언어데이터 공급이 가능합니다. 따라서 2014년 언어데이터 매출이 발생한 이후 당사의 매출은 빠르게 성장하고 있으며, 향후로도 타사대비 높은 경쟁력을 통해 시장을 선도하며지속적으로 성장할 것으로 기대됩니다.



나. 회사의 현황


(1) 사업 개황

주식회사 플리토는 플랫폼을 통해 수집된 말뭉치(코퍼스, Corpus)를 집단지성 및 검수 과정을 거쳐 정제한 후 이러한 언어 데이터를 필요로 하는 국가 연구기관 또는 IT 산업 내 다양한 기업고객 등에게 판매하는 사업을 영위하고 있습니다. 또한 언어데이터를 수집하기 위해 구축된 당사의 플랫폼을 통해 다양한 컨텐츠 관련 서비스를 제공하고 있습니다.

이미지: 플랫폼 구조도

플랫폼 구조도

(가) 언어 데이터 수집
정제된 코퍼스를 생산하기 위한 기존 방식은 소수의 해당 언어 전문가를 고용하거나 외부 의뢰하여 생산하는 방식으로서 이는 많은 시간과 비용이 소요되는 한계가 존재합니다. 당사는 기존 방식이 지닌 고비용/비효율 구조를 해결하기 위해 집단지성 방식의 플랫폼을 활용하였으며, 이를 다수의 플랫폼 참여자가 상호 검토를 통해 정제된말뭉치를 생성하므로 기존 방식보다 단축된 시간 및 절감된 비용 구조 하에서 높은 품질의 코퍼스를 생산할 수 있습니다.

당사는 다수의 참여자를 유입시키기 위해 단순 금전적 보상을 제시하는 수준에서 그치지 않고, '언어 학습'이라는 부가적인 효익을 제시하고 있습니다. 즉, 생산하고자 하는 언어 데이터를 개별 참여자에게 각각 생산을 의뢰하여 소액의 대가를 보상하는 것보다는, '언어 학습'이라는 목표를 가진 다수의 참여자에게 언어 데이터 생산 및 품질 검증의 역할을 부여하여 상호 견제를 할 수 있도록 플랫폼을 설계하였습니다. 즉. 자발적인 동기부여가 이루어진 참여자들을 대상으로 플랫폼 내 언어 데이터 생성 및 검증과 관련된 활동을 '학습' 형태로 유도하고, 실제 '언어 학습' 과정에서 타인의 품질 검증을 받은 언어 데이터 생산시 그에 따른 보상을 제공합니다.

이미지: 언어데이터 구축 절차

언어데이터 구축 절차


당사는 집단지성을 통해 참여한 많은 사람들의 상호 검증을 거친 언어 데이터를 확보할 수 있으므로 저렴한 비용으로 정제된 데이터를 얻을 수 있고, 참여자 입장에서는 '언어학습'이라는 개인적 목표 달성 중에 적절한 보상을 얻을 수 있어 만족할 수 있습니다. 또한, 참여에 따른 단순 금전 보상 외에도 참여자들의 주관적인 목표를 충족시킬 수 있어, 당사가 플랫폼 유입 및 활동을 위한 별도 유인책을 제시하지 않더라도 실제 플랫폼 내 참여자들의 활동이 매우 활발하게 이뤄지고 있습니다.

또한, 코퍼스 생산 과정에서 일반적인 원문이나 번역문의 코퍼스가 아니라 번역가 및발화자의 메타데이터(성별, 연령 등)를 포함한 언어 데이터를 형성하기 때문에 일반적인 코퍼스에 비해 더 높은 가치를 지닌 데이터 생산이 가능합니다. 특히 집단지성 방식의 언어 데이터 생성은 다수의 참여자가 활동하는 플랫폼 구축이 반드시 선행되어야 하며, 당사의 플랫폼은 이러한 측면에서 언어 데이터 생산에 강력한 이점을 지니고 있습니다.


(나) 언어 데이터 판매
당사는 집단지성 플랫폼을 통해 수집한 언어 데이터를 AI스피커, 전자상거래, 엔터테인먼트, 자동차, 여행 및 숙박, 요식업, 헬스케어, 등 다양한 산업군으로 구성된 글로벌 언어데이터 수요 기업에 판매 합니다.

글로벌 언어데이터 수요 기업의 경우, 자신들이 속한 산업군 및 향후 지향하는 사업 계획의 특성에 맞는 높은 수준의 세분화된 데이터를 요구 합니다. 따라서, 당사는 집단지성 검수를 통해 정제된 고품질의 언어데이터를 고객사의 필요에 맞추어 제공하게 됩니다.

(다) 주요 서비스

서비스 명칭

주요 내용

비고

언어 데이터

아케이드, 집단지성, 디스커버리를 통해 생산된 데이터는 CMS(Corpus Management System)을 거쳐 병렬 코퍼스로 저장됩니다. 데이터는 종류(텍스트, 이미지, 음성)와 언어, 퀄리티, 생산자의 정보에 따라체계적으로 분류/저장되어, 다양한 시장의 코퍼스 구매 수요에 유연하게 대처할 수 있는 경쟁력을 확보하고 있습니다. 

데이터 판매

아케이드

아케이드는 플리토의 각 서비스에서 생성된 언어 데이터들을 사용자들의 집단지성 참여방식으로 번역/검수를 진행하여 CMS(Corpus Management System)에 저장합니다.

언어 데이터 통합/관리

집단지성

집단지성 번역은 다수의 사용자들이 번역에 참여하여 빠르고 정확한 결과를 얻을 수 있는 번역 서비스입니다. 사용자는 텍스트, 이미지, 음성으로 번역을 요청할 수 있으며 25개 언어에 대한 번역을 지원합니다.

사용자 확보

원어민 교정

원어민에 의한 문법교정 및 현지화된 문체 수정을 통해 더욱 완벽한 문장을 요청자에게 제공하는 서비스입니다.

실시간 이미지 번역

플리토는 사용자들의 이미지 번역 요청에서 OCR 기술을 활용하여 텍스트 값을 추출한 후, 데이터베이스에 저장해둡니다. 이후 비슷한 위치에서 유사한 요청이 있을 경우, 저장해두었던 번역을 보여주게 됩니다. 사용자는 별도의 포인트가 수반된 요청 없이 실시간으로 이미지의 정확한 번역 값을 얻을 수 있습니다. 

다양한 유형의 데이터 확보

QR Place

음식점, 박물관 등 번역이 필요한 장소에서 QR Place를 생성하여 촬영한 이미지들을 일괄적으로 번역 요청하면, 생성된 웹에서 원본 이미지와 번역을 한 눈에 볼 수 있는 서비스입니다.

비디오자막 번역

Flitto 디스커버리의 비디오 메뉴를 통해 사용자들이 참여하여 영상 컨텐츠의 자막을 생성하고 다국어로 번역할 수 있는 서비스입니다.

디스커버리

전세계 글로벌 스타들의 SNS 소식을 모국어로 받아보며, 직접 번역에 참여할 수 있는 기능을 제공합니다. 사용자는 관심분야의 계정을 팔로우하여 자신의 Feed에서 번역된 문장으로 받아볼 수 있습니다. 

전문번역

요청자와 전문 번역가를 1:1로 매칭하는 서비스이며, 요청자는 번역가의 프로필과 번역 견적을 확인 후 선택할 수 있습니다. 이력서, 논문 및 업무에 사용하는 중요한 번역일 경우 1:1 전문번역을 사용하면 일정수준 이상의 퀄리티를 보장받을 수 있게 됩니다.

번역가 확보

Open API

플리토의 다양한 번역 서비스를 외부 기업이 연동하여 사용할 수 있도록 표준화된 기술 형식의 API를 제공합니다. 기업은 Open API 연동을 통해 Flitto의 번역 기능을 해당 기업의 플랫폼에 간단하게 통합할 수 있으며, 상호간 협의에 의해 절차를 간소화하거나, 파일 포맷을 특정하는 등의 커스터마이징 서비스를 제공하고 있습니다.

데이터 수집 채널 다양화


(라) 신규 사업
당사는 주요 사업이자 데이터 매출로 분류되는 언어 데이터 판매 사업 외에도 플랫폼매출로 분류되는 영상 콘텐츠 관련 번역 사업을 진행하고 있습니다. 당사의 영상 콘텐츠 관련 사업의 경우, 전방 시장인 인터넷 영상 콘텐츠 시장의 성장에 따라 수요가 증가할 것으로 사료 됩니다. 해당 시장의 성장은 트래픽을 통해 유추가 가능한 바, 시스코(Cisco)에 따르면 인터넷 영상 콘텐츠 시장의 경우, 2017년 대비 2022년 트래픽이 약 4.3배 증가 할 전망입니다.

[ 2017 ~ 2022년 인터넷 영상 콘텐츠 시장 규모 전망 ]


이미지: 2017 ~ 2022년 인터넷 영상 콘텐츠 시장 규모 전망

2017 ~ 2022년 인터넷 영상 콘텐츠 시장 규모 전망

이미지: 2017 ~ 2022년 인터넷 영상 콘텐츠 시장 규모 전망

2017 ~ 2022년 인터넷 영상 콘텐츠 시장 규모 전망

주) 출처: Cisco VNI

당사의 영상 콘텐츠 관련 사업의 경우, 당사 자체의 동영상 음성 소스 추출 및 음성 인식 기술(STT; Speech to Text)을 활용하여, 영상에서 텍스트 및 음성데이터를 번역 가능한 형태로 추출합니다. 그 후 집단지성을 활용하여 해당 텍스트 및 음성 데이터의 번역이 수행되며 이는 최종 문맥 검사 형태의 검수를 거쳐 판매 가능한 데이터로 정제됩니다. 이렇게 구축 및 정제된 영상 언어 데이터는 MCN 기업(인터넷방송 플랫폼에서 활동하는 1인 창작자들을 지원, 관리하며 수익을 공유하는 기업)등에 판매 됩니다. 현재 당사는 국내 미디어 그룹과 영상 번역 관련 계약을 완료 하였으며, 향후국내 뿐만 아니라 해외 영상콘텐츠 사용자를 대상으로 집단지성 방식을 활용하여 수준 높은 영상 자막 번역 서비스를 시행할 예정입니다.

(2) 언어별 목표시장
국내의 경우 한국어-영어, 한국어-일본어, 한국어-중국어가 가능한 사람들은 점차 많아지고 있지만, 한국어-아랍어, 한국어-네덜란드어, 한국어-스웨덴어 등을 할 수 있는 사람은 비교적 많지 않습니다. 반대로 해외의 경우 영어-스페인어, 영어-프랑스어, 영어-독일어 등 유럽 국가 언어 외에 아시아 국가 언어를 할 수 있는 사람은 비교적 적습니다.

이처럼 각 지역별로 언어전문가의 상대적인 불균형과 희소성이 존재함에 따라, 각 언어별 장벽이 발생하고 있습니다. 당사는 이러한 언어장벽을 해소할 수 있는 방안으로서 당사가 구축한 플랫폼을 운영하고 있습니다. 시간 및 장소의 제한이 없는 당사의 플랫폼에는 번역이 필요하거나 직접 번역을 할 수 있는 전세계 173개 국가의 사람들이 활발하게 서비스를 참여하고 있습니다. 당사의 플랫폼를 통해 참여자들은 각자의 언어장벽을 해소하며 만족도를 높일 수 있고, 당사는 참여자들의 자발적인 활동을 통해 다양한 언어데이터를 축적할 수 있습니다. 특히 당사 플랫폼은 주요 언어 외에도 소수언어까지 서비스되고 있어 참여자들의 만족도를 더욱 높이는 한편, 당사는 희소성 있는 언어데이터를 확보하여 더 높은 경제적 효익 추구가 가능합니다.


(3) 국가별 목표시장
구글(Google)을 필두로 전세계 주요 IT기업들은 독자적인 기계번역기 및 AI스피커 개발을 경쟁하고 있습니다. 기본적으로 독자적인 인공지능 생태계를 구축하여 각 기업들의 서비스 영향력을 극대화하고자 합니다. 해당기업들이 소재한 특정 지역에 국한된 인공지능이 아닌 전세계적으로 범용화된 인공지능을 개발하고 있으며, 이에 따라 인공지능 개발을 위해 다양한 종류의 데이터가 대량으로 요구됩니다. 이러한 인공지능 개발 경쟁의 흐름에서 당사는 다양한 지역에 소재한 주요 IT업체의 요구에 부합하는 다양한 형태의 언어데이터를 공급하고 있습니다.

[ 주요 IT 기업의 기계 번역기 서비스 현황 ]

국가

기업명

서비스

미국

Amazon

https://aws.amazon.com/translate

미국

Apple

Siri

미국

Google

https://translate.google.com

미국

IBM

https://www.ibm.com/watson/services/language-translator

미국

Microsoft

https://www.bing.com/translator

중국

Baidu

https://fanyi.baidu.com

중국

Tencent

https://fanyi.qq.com

일본

Mirai

https://miraitranslate.com/en/trial

러시아

Yandex

https://translate.yandex.com

한국

Kakao

https://translate.kakao.com

한국

Naver

https://papago.naver.com


(4) 언어 관련 인공지능의 연혁
언어와 관련하여 인공지능이 개발되어 우리 실생활에 쓰이는 가장 대표적인 사례는 기계번역기입니다. 기계 번역이라는 용어는 1949년 워렌 위버의 논문에 처음 언급이 되었으며, 1951년 MIT에서 본격적인 연구가 시작되었습니다. 연구 초기에는 5년 정도면 완전한 기계 번역이 될 것이라고 예측을 하였지만 성능이 기대에 미치지 못하면서한동안은 연구 수준에만 머물렀습니다.

1990년대에 등장한 SMT(Statistical Machine Translation)는 원문과 번역문이라는 병렬 Corpus를 활용해 통계적인 방법으로 번역을 하면서 기계 번역의 품질이 크게 향상되었습니다. 이후 2014년부터 등장한 NMT(Neural Machine Translation) 기술은 번역의 정확성을 한단계 더 끌어올리는 계기가 되었으며, Google, Microsoft, Yandex 등 주요 IT 기업들은 NMT를 기반으로 더욱 향상된 기계 번역 서비스를 제공할 수 있게 되었습니다.

[기계번역기에 적용되는 각 기술의 차이 비교]

구분

내용

규칙기반 (RBMT:

Rule-Based Machine Translation)

어법을 규칙화하여 번역하는 방법. 정확성이 높고 분야별전문성을 가지고 있으나 기술 개발에 시간과 비용이 매우많이 듦

통계기반 (SMT:

Statistical Machine Translation)

통계적으로 대용량의 병렬 말뭉치의 규칙들을 자동으로 모델링하여 통번역하는 것으로 딥러닝과 빅데이터 기술이 활용됨

신경망기반 (NMT:

Neural Machine Translation)

컴퓨터 스스로 최적의 가중치를 두어 번역대상 결과를 쌍으로 비교하여 최적의 데이터 도출 및 향후 자동 학습 업데이트


기계번역 이전까지 통번역은 무역 및 외교 등에 필수적인 기능으로서, 두개 이상의 언어를 할 수 있는 소수의 사람들에 의해 영위되어 온 전통적인 산업입니다. 하지만 최근에는 통신 및 IT 기술의 발달로 이전보다 손쉽게 다양한 언어권의 정보를 접할 수있게 되었습니다. 또한 이전과 같이 소수의 전문 번역가들에 의해 제공되는 고품질 및 고가격의 번역 뿐만 아니라, 빠르고 저렴한 번역 수요도 점차 증가하고 있습니다. 이에 IT 기업들은 이러한 빠르고 저렴한 번역 수요에 대응하기 위해 기계번역을 적극적으로 개발하여 서비스하고 있습니다. 전문번역가의 번역 대비 빠르고 저렴하지만 낮은 품질로 인하여 사용량이 많지 않았으나, 누적되는 언어 데이터 투입량에 따라 기계번역의 결과 또한 빠른 속도로 개선되고 있어 점차 사용량 또한 증가하고 있습니다.

[ 주요 IT 기업별 기계 번역기 및 출시연도 ]

기업명

서비스명

출시일

SYSTRAN, DEC

Babel Fish

1997년

Google

Google Translate

2006년

Yandex

Yandex.Translate

2011년

Microsoft

Microsoft Translator

2016년

Naver

Papago

2016년

Kakao

번역 Beta

2017년


기계번역이 등장하여 점차 그 사용량이 늘어난 이후, 언어와 인공지능이 결합되어 우리 실생활에 유용한 사례가 다수 나타나기 시작했습니다. AI스피커, 챗봇 등 기본적으로 언어와 인공지능 기술이 결합하면서 우리 생활의 편의를 높이고 있으며, 우리 생활 내에 필수적인 요소인 언어와 인공지능을 더욱 다양하게 활용하기 위해 기업들은 끊임없는 연구개발을 진행중입니다.


(5) 주요 수요 변동 요인

(가) 인공지능 개발과 관련된 수요 증가
최근 딥러닝 기술의 등장으로 인하여 인공지능 분야는 빠르게 혁신되고 있습니다. 실제 딥러닝 기술을 통한 인공지능 개발은 전자, 제조, 금융, 의료, 자동차 등 거의 모든산업에 영향력을 미치고 있으며, 이러한 추세 변화와 인공지능의 영향력에 민감한 구글, 페이스북, 아마존 등 해외 주요 IT 기업들은 인공지능을 미래 핵심기술로 여기며 상호 경쟁을 통해 인공지능 플랫폼 생태계를 만들어 나가고 있습니다. 특히 이들은 인공지능을 플랫폼화하여 산업 생태계를 주도하고자 하며, 플랫폼을 통한 혁신과 새로운 기회를 창조하고자 합니다.

이미지: 해외 주요기업이 주도하는 인공지능 플랫폼

해외 주요기업이 주도하는 인공지능 플랫폼

주) 출처 : 과학기술일자리진흥원

인공지능 플랫폼의 확장과 더불어 기계가 인간의 언어를 인식하기 위한 언어 인식 기술에 대한 연구도 확대되고 있으며, 이는 애플 시리(Siri), 아마존 알렉사(Alexa)와 같은 지능형 비서 서비스의 활성화로 이어지고 있습니다. 이러한 언어 인식 분야는 다양한 언어로 확대되고 있으며, 이에 따라 언어별 데이터에 대한 수요 또한 증가하고 있습니다. 특히 일상 생활에 밀접하게 사용되는 인공지능의 경우 빠른 환경변화 속에서도 정확하게 사용자간 의사전달을 하기 위해서는 고품질의 언어 데이터가 무엇보다 중요하게 여겨지고 있습니다.

하지만 현재 플랫폼 확대를 목표로 하는 업체들은 인공지능 개발에 필수적인 데이터 확보에 큰 어려움을 겪고 있습니다. 단순히 방대한 양의 빅데이터를 확보하는 것 뿐만 아니라 상황별 조건에 부합하는 데이터의 질적(Quality)인 측면까지 고려되어야 하기 때문입니다. 실제 딥러닝에 있어서 데이터의 질(Quality)은 데이터의 다양성과 함께 기계 학습이 가능한 형태로의 전처리 과정이 필수적입니다.

이처럼 인공지능 기술의 급격한 성장과 더불어 양질의 빅데이터가 요구되는 현재 시점에서 당사는 기존 인공지능 업체들에 효과적인 방안을 제시하고 있습니다. 당사는 플랫폼을 통해 이러한 시장의 수요에 대응할 수 있는 텍스트, 이미지, 음성, 영상 등의 데이터를 생성해 내고 있으며, CMS(Corpus Management System) 시스템을 통해 딥러닝에 적합한 형태로 언어 데이터를 제공할 수 있습니다.


(나) 정부기관의 수요 증가

인공지능 개발을 위한 데이터의 가치가 높아지면서 공공의 목적에 따라 국가 차원의 데이터 확보를 위한 사업 또한 증가하고 있습니다. 이에 당사는 2014년 정부기관과의적극적인 협업을 통해 공공 데이터 구축 사업을 진행해오고 있습니다. 당사는 2014년부터 매년 정부기관의 발주사업을 수주하여 성공적으로 진행하고 있으며, 향후 인공지능의 중요성이 증가함에 따라 향후 발주되는 사업의 규모 또한 증가할 것이라 예상하고 있습니다.

특히 올림픽 등과 같은 주요 국가행사를 대비하기 위해 인공지능 개발과 언어데이터 구축은 더욱 다양하게 이루어질 것이라 기대합니다. 과거 2018년 평창올림픽을 대비하는 과정에서 당사는 다양한 정부기관 및 관련 기업들과 언어데이터 구축 사업을 진행한 경험이 있습니다. 현재 2020년 도쿄올림픽의 개최로 일본 내 고객사와의 논의가증가하고 있으며, 한국과 일본 외에도 다양한 지역에서 발생할 국가 행사로 인하여언어데이터 수요는 증가할 것이라 예상됩니다.


(다) 기타 다양한 산업군 내 수요 증가
인공지능 개발업체 및 정부기관 관련 업체 외에도 당사는 다양한 분야의 업체들과 언어데이터 공급을 논의중입니다. 단순히 인공지능이라는 기술이 특정 IT 영역에서만 활용되는 것이 아니라, 각 기업들의 제품 및 서비스와 결합하는 추세에서 인공지능을개발하려는 기업들도 다양해짐에 따라 당사의 거래서 또한 다양해지고 있습니다. 기존의 전통적인 IT 업체들이 기계번역 기술 향상 등의 목적으로 텍스트 형태의 언어데이터를 중심으로 당사와 거래를 진행했다면, 최근 당사와 논의중인 업체들은 제조업,유통업 등 다양한 산업으로 분류되고 있으며 당사에 요청하는 언어데이터 또한 음성 및 이미지 등 다양하게 논의되고 있습니다. 이러한 신규 산업군의 수요는 인공지능의확장성에 따라 당사의 언어데이터 또한 다양한 거래처로 수요가 확대될 수 있음을 보여주고 있습니다.

(6) 규제환경
당사가 영위하는 Corpus 구축 및 판매 사업에 대한 직접적인 규제 환경은 없는 것으로 파악됩니다. 하지만 저작권 및 개인정보 보호 등 잠재적인 위험을 해소하고자 당사는 당사 플랫폼 참여자들의 활동에 따라 생성된 언어데이터를 당사가 활용할 수 있음을 약관상 명시하였으며, 이를 참여자들로부터 사전에 동의받고 있습니다.

[ 서비스 이용약관 제15조 제3항, 제6항(게시물의 저작권) ]
“사용자”가 제공한 원문 내에“사용자”의 저작물이 있는 경우“사용자”는 그 저작물 부분에 대하여는 이를“회사”가 번역문을 만들거나, 제3자에게 사용권을 부여하는 등 영리목적으로 사용하는 것을 허락한 것으로 봅니다.

“회사”는“사용자”가 제공한 데이터(제2항에 따라 수정된 원문 포함, 이하 같다)를 번역문을 만드는 데에 사용하거나, 회사 외의 제3자에게 사용권을 부여하는 등 영리목적으로아무런 제한 없이 사용할 수 있습니다.



다. 산업 내 경쟁형태 및 비교우위

(1) 인공지능 목적 언어데이터

(가) 경쟁업체의 특성
기존의 언어데이터 시장은 통번역 시장과 밀접하게 연결되어 형성되어 있습니다. 실제 대부분의 언어데이터 공급업체는 통번역 및 현지화 사업을 영위하고 있으며, 국가별로 강점을 가진 소규모 업체들이 언어데이터 수요에 따라 산발적으로 공급하고 있습니다. 번역업체는 각지역을 기반으로 하는 번역가 네트워크를 핵심역량으로 확보하고 있으나, 특정지역에 한정된 소규모 집단이라는 한계가 존재합니다. 이에 IT 기술의 발달로 언어 데이터의 중요성이 부각되면서, 많은 참여자에 의해 다양한 조건으로고객사의 요청이 다변화하고 있으며, 이러한 다변화된 요구에 부합하는 신규 언어데이터 공급업체들이 등장하기 시작했습니다. 이들은 아래와 같은 특징을 가지고 언어데이터 공급 사업을 확대해 나가고 있습니다.

[ 신규 언어데이터 공급업체의 특징 ]

구분

내용

온라인 마케팅을 통한 다양한 국가의 번역가 확보

온라인 서비스를 기반으로 하는 대부분의 기업은 UA (User Acquisition: 사용자 획득)를 통하여 다양한 국가의 번역가를 자신들의 생태계에 편입시키고 있습니다. 이들은 국가별 법인 설립 없이도 현지화를 통하여 현지 번역가를 유입합니다.온라인 서비스를 기반으로 하는 대부분의 기업은 UA를 통하여 다양한 국가의 번역가를 자신들의 생태계에 편입시키고 있습니다. 이들은 국가별 법인 설립 없이도 현지화를 통하여 현지 번역가를 유입합니다. 

데이터 생산 시스템

인공지능과 관련된 언어 데이터 산업은 방대한 양의 표본을 필요로 하며, 각 표본들은 산업분야, 상황, 데이터의 길이, 종류 등에 따라서 다양하게 구성됩니다. 기업들이 필요한 데이터를 빠르게 처리하고 생산하기위해서는 전 과정이 시스템화 되어야 하므로 IT기술력과 업력이 매우 중요합니다.

글로벌 영업

언어 데이터가 필요한 기업군은 일반적으로 자동차, Wearable 기기 제조기업, 국가별 통신사, 인터넷 플랫폼 기업, 콘텐츠 기업 등이며, 대부분 전세계 시장을 대상으로 서비스하는 대규모 기업들입니다. 이들은 데이터 생산에 따르는 보안 문제를 최소화하기 위하여 극소수의 기업들과 강력한 영업 네트워크를 구축하고 있습니다.


(나) 경쟁 현황

2016년 신경망을 활용한 언어 인공지능 기술(NMT)이 실용화된 것을 시작으로 구글이 선제적으로 이를 발표하는 한편 NMT 기술과 관련된 API (Application Programming Interface)를 제공하며 본격적으로 언어 인공지능 시장의 규모가 확대되고 있습니다.이러한 추세 속에서 네이버, 삼성, 바이두, 텐센트, NTT 도코모, 아마존, 애플 등 주요 IT 기업들이 경쟁적으로 언어 인공지능 개발 분야에 진입하였으며, 이를 활용한 서비스가 사람들의 실생활에 실질적으로 사용되기 시작했습니다. 2018년 이후부터는언어 인공지능 기술을 일반 기업이나 개인들도 범용적으로 개발하고 서비스에 적용할 수 있게 되었으며, 이러한 개발을 통해 음성 편집, 챗봇, 동시 통역, 영상 번역 등의 서비스로 확장되고 있습니다.

언어 인공지능 분야는 기하급수적으로 성장하고 있지만 막상 언어 데이터는 턱없이 부족한 실정입니다. 이는 주요 IT기업들이 인공지능 기술 개발 자체에 초점을 두고 있지만, 인공지능을 학습시키기 위한 데이터 수집에는 상대적으로 소홀히 했기 때문입니다. 마치 기술력 있는 자동차들은 경쟁적으로 개발되고 있지만 자동차를 움직이기 위한 연료는 한정적인 것과 같습니다. 이러한 언어데이터의 초과 수요 상황에서 실제언어데이터를 공급할 수 있었던 공급처는 번역업을 영위하거나 과거 기계번역기등의 언어DB 사업에 참여했던 소규모 업체들이 대부분이었습니다. 이들이 보유한 언어데이터량은 인공지능 개발을 위한 수요 대비 매우 부족했음에도  희소한 언어데이터를 공급가능한 업체가 한정적이다보니 주요 IT기업들과 계약이 이루어졌고, 이를 통해 공급처들에게 새로운 수익을 제공하기 시작하였습니다. 특히 공급처들의 낮은 경쟁력과 낮은 품질의 언어데이터에도 언어데이터 시장내 초과수요로 인하여 관련 매출이 증가하고 있는 상황입니다.


(다) 당사의 경쟁력 및 비교우위
최근 언어 인공지능 개발을 진행하는 다수의 기업들은 신경망 번역(NMT)에서 사용되는 딥러닝(Deep Learning) 기술, 불필요한 잡음을 걸러내고 정확한 음성만을 반영하는 음성 인식(Voice Recognition), 자연언어처리(Natural Language Processing) 등의 개발을 진행중이며, 이를 위해서는 최대한 많은 병렬 Corpus와 음성 데이터가 요구됩니다. 단순히 많은 언어데이터가 아니라 높은 품질을 갖춘 데이터가 투입되어야 인공지능 개발의 효과가 높으며, 양질의 언어 데이터 확보를 위해 인공지능 개발을 진행중인 기업들은 각별한 노력을 기울이고 있습니다.

고객사의 요구에 부합되는 언어데이터를 구축을 위해서는 기본적으로 많은 어려움이존재합니다. 각 언어별로 언어데이터를 일정기간 내에 생산 가능한 사람을 적절히 확보하는 한편, 확보된 사람별로 일관된 품질을 유지해야 합니다. 음성데이터의 경우 사람마다 각기 다른 억양, 발음 등의 차이를 최소화하면서 공통적인 음성 파형을 추출하기 위해서는 가급적 많은 사람들이 동일한 조건에서 생산한 음성데이터를 구축해야 합니다. 이러한 어려움으로 인하여 양질의 언어데이터를 대량으로 구축하기가 현실적으로 불가능하며, 언어데이터 구축사업에 진입하려는 신규경쟁자에게 진입장벽으로 작용하고 있습니다.

현재 언어데이터를 공급하는 대부분의 공급처는 전문가 생산방식을 통하여 언어데이터를 구축하고 있습니다. 언어데이터를 취급할 수 있는 소수의 번역가 등 전문가를 고용하여 제한된 일정과 예산 하에서 언어데이터를 생산해 내고 있습니다. 이러한 방식은 소수의 인원을 동원하기 때문에 품질이 일관되지 않을 뿐만 아니라 언어데이터 구축에 상당히 오랜 기간이 소요됩니다. 전문가를 고용하는 과정에서 비교적 높은 비용이 발생하는 한편 소수의 전문가 확보에 실패하는 경우 언어데이터의 구축 자체가 불가능한 한계가 존재합니다.

이와 달리 당사는 플랫폼 내 집단지성을 활용한 생산방식으로 언어데이터를 구축하고 있습니다. 플랫폼 내에 참여하는 1천만명 이상의 유저들을 통해 상시 생산되어 구축되는 당사의 집단지성 방식은 전문가 생산방식 대비 낮은 비용에도 빠르고 정확한 언어데이터의 구축이 가능합니다. 소수의 참여자를 기준으로 언어데이터의 생산이 진행되는 것이 아니라 다수의 참여자가 생산 및 상호 검증을 거쳐 더욱 정교화된 언어데이터의 생산이 이루어집니다. 173개국 25개 언어를 기준으로 서비스 되는 당사 플랫폼 내에서 조달되는 언어데이터는 비교적 소수의 언어 또한 구축이 가능한 장점이 존재합니다. 이러한 집단지성 방식의 장점을 기반으로 당사는 매년 언어데이터의 공급량을 증가시키고 있으며, 거래를 시작하는 업체수 또한 증가 추세입니다. 기본적으로 빅데이터 기반의 인공지능 기술 개발의 핵심은 최대한 많은 데이터를 빠르고  정확하게 제공하여 인공지능의 학습이 진행되어야 하므로, 전문가 방식의 언어데이터 생산은 고객사의 언어데이터 수요를 지속적으로 충족시킬 수 없습니다. 이에 당사의 집단지성 방식의 언어데이터 생산은 속도, 가격, 종류, 품질 등에서 타 경쟁사 대비 높은 경쟁력을 갖춘 것으로 평가됩니다.

[ 타사와 당사의 언어데이터 구축방식 비교 ]

구분

전문가 기반 데이터 구축

당사 집단 지성 방식 데이터 구축

속도

소수의 전문가에 의해 제한적으로 생산되기 때문에 구축 속도가 매우 느림

모바일 및 웹을 통하여 장소/시간에 상관없이 누구나 구축할 수 있어 매우 빠름

구축비용

전문가의 요구비용이 높아 언어데이터의 구축비용이 높음

다수의 참여자가 경쟁방식으로 구축을 진행하기 때문에 비용이 낮음

정확도

소수의 전문가의 구축 이후 검증이 이루어지지 않는다면 인적오류(Human Error)의 가능성이 높음

다수의 참여자를 통해 상호 견제 및 검증이 이루어지므로 정확도가 매우 높음

구축규모

소수의 인원이 진행하여 제한조건내 생산가능한 데이터 규모가 적음

다수의 참여자를 통해 제약없이 하루에 수만개의 데이터를 상시 구축 가능


타사와 언어데이터 구축 방식의 차이 외에도 당사는 아래와 같은 독자적인 특성을 통해 타사대비 차별화되는 언어데이터 공급이 가능합니다.

1) 여러 종류의 언어에 대한 병렬 Corpus 제공 가능

언어는 연속성의 성격으로 인해 시대 및 환경의 변화에 따라 끊임없이 변하고 있습니다. 매년 수많은 표현과 신조어가 생성되고 있으며, IT 기술의 발달로 일상적으로 사용되는 언어 또한 끊임없이 확장되고 있습니다. 이러한 흐름 속에 기존 언어데이터를유지하며 추가 수정반영하지 않는다면 언어데이터로서의 가치가 감소할 수 밖에 없습니다. 과거 1998년부터 2007년까지 국립국어원에서 주관한 '세종 말뭉치 사업'이 사업 기간 종료 이후 업데이트가 중단되었으나, 정부도 이러한 문제점을 인식하여 2018년부터 2022년까지 175억원을 투입해 '인공지능용 한국어 말뭉치 구축 사업'을 진행하기로 발표하였습니다.

당사는 플랫폼을 통해 25개 언어를 지원하고 있으며 경제, 예술, 역사, 생활, IT 등 각주제별로 문어체뿐만 아니라 구어체 등 다양한 문장들의 구축이 이루어지고 있습니다. 동일한 문장에 여러 사람이 번역에 참여하였을 경우 어떤 번역이 좋은지 추천하여 하나의 번역이 채택되고 있으며, 이 과정을 거친 문장들은 CMS(Corpus Management System)에 저장되고 있습니다.

이러한 병렬 Corpus는 다른 언어와의 조합을 통해 새로운 병렬 Corpus로 확장됩니다. 예를 들어 번역 요청을 통해 1쌍의 한국어-영어 병렬 Corpus가 만들어졌다면, 한국어 또는 영어 문장을 일본어, 중국어 등 다른 언어로 확장시켜 추가 조합을 구성하는 방식으로 새로운 병렬 Corpus를 생산합니다.


2) 저렴한 언어데이터 생산 가격

병렬 Corpus를 구축하기 위해서는 목적에 맞는 최초의 Corpus로부터 시작되며, 해당 Corpus 생산작업은 타사의 경우 번역가들이 번역을 하게 됩니다. 이러한 방식은 물리적인 시간뿐만 아니라 비용도 많이 들기 때문에 효율적인 방식이라 하기 어렵습니다. 당사의 경우 플랫폼 내에 전문번역가 및 2개 이상의 언어를 구사할 수 있는 참여자들이 다수 확보되어 활동중입니다. 요청자와 번역가의 상호 거래를 통해 자연스럽게 생성된 언어데이터를 기준으로 당사는 병렬Corpus를 구축하게 되며, 다수의 참여자를 통해 타 언어로 순식간에 확장되기 때문에 언어데이터의 생산단가를 크게 낮출 수 있습니다. 전문 번역가가 아닌 일반 참여자들이 참여한 경우 균일한 품질의 우려가 있지만, 플랫폼 내 다양한 참여자간 상호 검증을 여러번 거치도록 설계되어 있습니다. 이러한 QC(Quality Control) 과정을 거치면서 언어데이터는 더욱 정교화 되며 최종적으로 고객사에서 요구하는 품질 조건에 부합하게 됩니다.


3) 요구조건에 부합하는 참여자 선택 가능
특정 언어에 대해 각 개인별로 수준의 차이가 있으며, 익숙한 주제로 구분시 그 차이는 더욱 커지게 됩니다. 이는 일반 참여자 외에 전문번역가 또한 마찬가지입니다. 즉 개인별로 익숙하거나 전문적인 지식을 갖춘 분야가 있기 때문에, 동일한 언어 데이터의 생산에도 각 개인별 조건에 따라 다른 품질과 결과물이 도출됩니다. 당사는 플랫폼 내 누적된 데이터를 기반으로 참여자의 전문영역을 구분하는 기술을 활용하여, 더욱 효과적인 언어데이터 생산을 유도합니다. 언어데이터 생산과 관련하여 무작위로 담당자를 배치하는 것이 아니라, 적절한 인원을 중심으로 대응이 가능합니다.

주제 외에도 세부적인 언어 조건 또한 파악이 가능합니다. 당사의 플랫폼은 전세계 참여자들로 구성되어 있으며 참여자들의 상시 활동이 이루어지고 있기 때문에, 각기 소재한 지역과 모국어 여부 등 세부 조건의 파악이 가능합니다. 예를 들어 고객사로부터 영어와 관련된 언어데이터의 요청이 있는 경우, 단순히 영어 형태의 언어데이터조건 외에도 미국, 영국, 호주 등 영어권 국가의 설정이 가능하며 이외에도 성별, 나이 등의 조건을 설정하여 언어데이터의 구축 및 공급이 이뤄지고 있습니다. 이를 통해 당사가 보유한 언어데이터의 추가적인 가치 상승을 기대할 수 있으며, 고객사의 당사 언어데이터에 대한 만족도 또한 높일 수 있습니다.

4) 모바일 앱의 편리한 사용성

당사는 웹사이트 외에도 모바일 어플리케이션을 통해 플랫폼 서비스를 유저에게 제공하고 있습니다. 실제 모바일의 편리한 특성으로 당사의 앱을 통해 수집되는 언어데이터가 크게 증가하고 있습니다. 대부분의 언어데이터 공급처는 오프라인을 통해 전문가 방식으로 데이터를 구축하고 있으나, 당사는 휴대기기를 이용하는 모든 사람들이 별도의 제약없이 플랫폼에 접속하여 언어데이터 생산에 참여할 수 있으므로 별도의 제약이 존재하지 않습니다.


(2) 플랫폼 내 언어서비스 산업

(가) 경쟁업체의 특성
번역 및 현지화 시장은 전통적이고 보수적인 시장으로서 전형적인 포화시장(Red-ocean)입니다. 현재 외국계 위주의 글로벌 번역기업들이 주요 번역시장을 점유하고 있으며, 각 지역에 특화된 소규모 번역기업들은 지역 단위 업무를 수행하고 있습니다. 글로벌 번역기업들은 시장 경쟁력을 유지하기 위하여 아래와 같은 전략을 사용하고 있습니다.

[글로벌 번역기업의 특징]

구분

내용

현지 법인 설립을

통한 영업 전략

글로벌 번역기업들은 주요 지역 내 현지 법인을 설립하여 영업망을 구축하고 번역가 생태계를 만들어 가고 있습니다. 이를 위해 각 지역의 해외지사들은 현지 언어권에 맞는 번역가들을 공유하며, 가장 높은 수준의 품질을 유지합니다. 이들은 동일한 방법으로 다양한 국가에 진출하고 있으며, 전 과정에서 선순환 구조를 보이고 있습니다. 

번역 S/W 판매를

통한 락인효과

글로벌 번역기업들은 주요고객과의 지속적인 계약을 위하여 자체적으로 제작한 번역 S/W를 판매 혹은 무상지원하고 있습니다. 번역용역 계약의 형태를 시스템화하여 향후로도 고객사와 지속적인 비즈니스 관계를 이어가기 위함입니다.


(나) 당사의 경쟁력 및 비교우위
기존의 언어서비스 제공 기업들은 대부분 소규모 조직에 의해 조달된 번역가 등을 통해 제한된 조건 하의 업무를 수행하고 있습니다. 이러한 조건 하에서 각 기업들의 핵심역량은 언어별로 조달가능한 전문가 여부가 되며, 전문가 고용에 따른 고비용에도 제공받는 서비스의 체계도와 투명성이 낮아 신뢰가 낮습니다.

당사는 이러한 문제의식에서 당사의 플랫폼 내에 제공하는 번역 등 각종 언어서비스를 체계적이고 투명하게 운영하여 플랫폼 참여자들의 신뢰 향상을 목표로 하고 있습니다. 플랫폼 내에 제공되는 집단지성 및 아케이드는 유저들의 참여결과를 투명하게 공개하고 있습니다. 또한 전문번역을 통해 높은 보안이 요구되는 기업고객의 언어서비스 요청에도 체계적으로 대응하여 기업 고객에게 더욱 효과적인 결과물을 전달할 수 있습니다. 이러한 모든 서비스는 플랫폼에서 참여자간 자생적인 거래로 이루어지며, 시간과 장소의 제약이 없으므로 참여자간의 만족도 또한 증가하고 있으며, 이는 당사가 기존 언어서비스 제공 기업 대비하여 높은 차별 요소로 작용하고 있습니다.



2. 주요 제품 등에 관한 사항

가. 주요 제품 등의 현황
당사의 최근사업연도 및 당분기의 주요제품현황은 아래와 같습니다.


(단위 : 천원)

품 목

제9기 1분기
매출액 (비율)

제8기
매출액 (비율)

제 품 설 명

데이터 판매

998,297
(69.73%)

939,790
(50.48%)

플랫폼 내에 수집된 언어 데이터를 판매하는 서비스
플랫폼 서비스

433,282
(30.27%)

922,099
(49.52%)

집단지성, 전문번역, API, QR 등 플랫폼 내에 제공하는
각종 언어서비스

합계

1,431,579
(100.00%)
1,861,888
(100.00%)

-

주) 상기 금액은 별도재무제표 기준으로 기재하였습니다.

나. 주요 제품 등의 가격 변동 추이
현재 언어데이터의 형태(Text, Voice 및 Image)와 언어종류에 따라 단가에 큰 차이가나타나고 있습니다. 각 제품별 세부 변동요인은 아래와 같습니다.

구분

변동 요인

데이터 판매

데이터 판매 계약 규모가 확대되고, 언어당 단가도 높아지면서 데이터판매 평균단가가 상승하고 있습니다. 

플랫폼 서비스

플랫폼 생태계의 활성화로 인하여 플랫폼 내 체결되는 거래건수가 증가하는 한편, 고품질의 언어서비스를 기대하는 참여자들의 수요 증가로 관련 단가 또한 상승하고 있습니다.



3. 주요 원재료에 관한 사항

가. 매입 현황 

(단위: 천원)
매입유형품목2020년2019년2018연도2017연도
(제9기 1분기)(제8기)(제7기)(제6기)
지급
수수료
데이터 판매204,1651,057,866983,618497,498
플랫폼 서비스291,648534,191316,839507,714
기타 지급수수료182,8861,865,771256,942287,626
합계678,6993,457,8281,557,3991,292,838

주1) 상기 금액은 별도재무제표 기준으로 기재하였습니다.

나. 원재료의 제품별 비중

당사는 생산설비 등을 통한 재고자산 내역을 보유하고 있지 않습니다. 이에 보고서 작성 기준일 현재 해당사항이 없습니다.



4. 생산 및 생산설비에 관한 사항

가. 생산능력 및 생산실적
당사는 무형의 언어데이터를 기반으로 한 데이터판매와 플랫폼 내 제공되는 언어서비스를 주된 사업으로 영위하고 있습니다. 이에 별도의 생산활동이 발생하지 않고 있으며, 이에 보고서 작성 기준일 현재 해당사항이 없습니다.

나. 생산설비에 관한 사항
당사는 무형의 언어데이터를 기반으로 한 데이터판매와 플랫폼 내 제공되는 언어서비스를 주된 사업으로 영위하고 있습니다. 이에 별도의 생산활동이 발생하지 않고 있으며, 이에 보고서 작성 기준일 현재 해당사항이 없습니다


5. 매출에 관한 사항

가. 매출개요


(단위 : 천원)
구분구분제9기 1분기
(2020년)
제8기
(2019년)
제7기
(2018년)
제6기
(2017년)
영업
수익
데이터 판매내수-459,8901,286,575936,647
수출998,297479,9001,206,949365,759
플랫폼 서비스내수433,282922,099773,055849,333
합계1,431,5791,861,8893,266,5782,151,740

주) 상기 금액은 별도재무제표 기준으로 기재하였습니다.

나. 판매경로
당사는 언어데이터의 판매를 위해 고객처와 직접 계약 체결후 직접판매를 하고 있습니다. 또한 당사의 플랫폼 내 언어서비스 제공은 당사 시스템 내에서 유저가 결제 등을 진행하고 있습니다.

다. 매출원가
당사는 재고자산을 보유하고 있지 않으므로 보고서 작성 기준일 현재 해당사항이 없습니다


라. 판매전략

당사가 판매하는 언어 데이터의 수요처는 크게 B2G와 B2B로 구분할 수 있습니다.

국가 연구기관은 매년 예산 제한이 있긴 하나, 사기업에 비해 데이터 수요량이 방대하고 사업의 연속성 및 지속성이 보장됩니다. 트렌드에 맞추어 개발(R&D) 포트폴리오가 시시각각 변하는 사기업에 비해 국가연구기관은 매년 예산을 배정받아 중장기 사업으로 구상할 수 있는 여지가 많습니다. 이에 플리토의 비즈니스 포트폴리오 내 중장기 사업 전략으로 포지셔닝이 가능합니다

또한, B2B 고객군은 크게 1) IT 대기업 2) Technology 기반 SME(Small-medium enterprise) 3) 전략적 제휴가 가능한 경쟁사로 분류할 수 있습니다. 데이터의 품질 및 플랫폼 서비스 개선을 통한 고객만족강화를 목표로 기존거래처와 전략적 파트너십을더욱발전시켜 나갈 것이며, 신규거래처 발굴을 통한 거래처 다변화등으로 매출을 증대 시킬 계획입니다.

마. 주요 매출처
보고서 작성기준일 현재, 당사의 주요 매출처는 미국 소재 IT 기업 A사, 국내 소재
종합 콘텐츠 기업B사, 미국 소재 게임 소프트웨어 개발 및 공급사 C사, 국내 관공서 등이 있으며 각 매출처 비율은 매출액 대비 62.11%,13.38%, 1.75%, 0.55%입니다. 주요 매출처는 중요성의 관점에서 국내외 고객사별 매출액 중 큰 부분을 차지하는 거래처를 표시하였습니다.

※ 고객사 별 매출처 비율은 보고서 작성기준일 현재 연결 손익계산서 상 매출액을 기준으로 하였으며, 세부 고객사명은 계약 상대방의 영업비밀 보호요청에 의해 알파벳으로 표기하였습니다.

6. 수주현황

(단위 : 원)
구분금액데이터 유형
데이터 판매1개사77,893,755텍스트/음성
플랫폼 서비스2개사85,892,600-
합계85,892,600-

※상기 수주현황은 본 보고서 작성 기준일인 2020년 3월 31일 현재 거래가 종료되지아니한 계약사항이며, 2020년 1월 1일 이후 계약체결부터 2020년 3월 31일 매출인식 전까지의단계입니다. 또한, 매출인식 금액은 환율 변동 등의 사유로 인하여 일부 변동가능함을 유의하시기 바랍니다.


7. 시장위험과 위험관리
당사는 최근 사업연도말 현재 자산총액이 1천억원 미만인 소규모 기업에 해당하며,기업공시서식 작성기준에 따라 본 항목을 기재하지 않습니다.


8. 파생상품 및 풋백옵션 등 거래현황
당사는 보고서 작성 기준일 현재 보유하고 있는 파생상품은 없습니다.


9. 경영상의 주요계약
당사가 최근 3년이내 체결된 경영상의 주요계약은 아래와 같습니다.

계약체결일

계약내용
2017.11.28본사 임대차 계약 (서울 삼성동)
2019.08.08본사 이전 임대차 계약 (서울 역삼동)



10. 연구개발활동

가. 연구개발 조직
당사는 
CTO가 연구개발조직을 총괄하고 있으며, 보고서 작성 기준일 현재 연구개발인력은 총 26명으로 전사 인원의 약 38% 연구 개발 직원으로 근무하고 있습니다. 당사의 연구개발조직은 하기와 같이 서버 개발팀/클라이언트 개발팀/UXD팀으로 구분할 수 있습니다.

이미지: 연구개발조직 현황

연구개발조직 현황

서버 개발팀은 당사의 서버 백엔드 위주의 개발을 주로 합니다. 서버 개발팀은 크게 서비스 개발팀과 플랫폼 개발팀, 그리고 미래기술 및 AI 개발팀으로 나뉩니다. 서비스 개발팀은 당사의 집단지성 번역/교정, 1:1 전문 번역/교정, SNS 및 Video 번역을 개발합니다. 플랫폼 개발팀은 Corpus Management System/Arcade 등의 플랫폼 위주의 기능을 개발합니다. 미래기술 및 AI 개발팀은 다른 두 팀에서 만들어진 데이터를 더욱 잘 활용하기 위한 연구를 진행합니다.

클라이언트 개발팀은 당사 서비스를 사용하는 사용자의 접점이 되는 웹페이지 및 아이폰/안드로이드 앱 개발을 주로 합니다. 클라이언트 개발팀은 크게 웹프론트엔드 개발팀과 앱 개발팀으로 나뉩니다. 웹프론트엔드 개발팀에서는 다양한 브라우저에서서비스가 가능하도록 하며, 최신의 기술을 사용 중입니다. 앱 개발팀에서는 대표적인스마트폰 OS인 Android 와 iOS 두 가지에 대하여 속도 및 성능에서 강점이 있는 Native기술을 이용하여 개발합니다.

 

UXD팀은 사용자와 서비스의 인터렉션을 연구하는 팀입니다. 각종 툴을 이용하여 서비스 상에서 사용자의 반응을 살피고, 좀 더 적극적이고 긍정적인 반응이 일어날 수 있는 연구 및 이에 대한 서비스 적용을 진행합니다.


나. 연구개발인력현황
2020년 3월 현재 사는 석사급 3명 등 총 26명의 연구인력을 보유하고 있으며, 핵심연구개발 인력은 아래와 같습니다.

학력

박사

석사

학사

기타

인원수

-

323

-


당사의 주요 연구개발인력은 강동한CTO, 김진구CSO를 비롯하여 유관 업무 경력이풍부한 인력들로 구성 되어 있습니다.

직 위

성 명

담당 업무

주요경력

기술

본부장

강동한
(CTO)

연구개발총괄

플랫폼

기술 총괄

플리토 플랫폼 개발 총괄(12.09~現)

SK텔레콤, SK플래닛(08.01~12.08)

Xroad (04.06~08.08)

연세대학교 컴퓨터과학 학사(08.02)

기술

본부장

김진구
(CSO)

모바일

기술총괄

플리토 클라이언트 개발 총괄(12.09~ 現)

SK텔레콤, SK플래닛(06.01~12.08)

포항공과대학교 컴퓨터공학 학사(06.02)

기술

본부장

김상균

UXD 총괄

플리토 UXD 총괄(16.07~現)

BRID, Funda, Passport Asia Korea

일본 타마미술대학교 Information Design 학사(10.03)

책임

연구원

박재흥

머신 러닝 총괄

플리토(18.08~現)

SK플래닛(11.10~15.10)

SK텔레콤(08.01~11.09)

서울대학교 전기공학부 학사(07.08)

책임

연구원

김호연

모바일 클라이언트 총괄

플리토 클라이언트 기술 개발(15.04~現)

GnB교육, Urapp CTO, 스마투스

고려대학교 신소재화학 학사(12.02)


다. 연구개발비용

 (단위 : 천원)

구 분

제9기 1분기
(2020년)

제8기
(2019년)

제7기
(2018년)

제6기
(2017년)

비용처리

제조원가

----

판관비

220,540705,103

426,240

6

합 계(매출액 대비 비율)

220,540
(15.4%)

705,103
(37.9%)
426,240
(13.1%)

6
(0.0%)


라. 연구개발실적

당사가 최근 3년이내 완료된 연구개발실적은 아래와 같습니다.

연구과제명

연구결과 및 기대효과

상품화

여부

비고

텍스트 데이터 정제

-수집한 텍스트 데이터에서 잘못된 문장 부호나 오탈자를 수정하고, 언어별 텍스트 데이터의 유사도를 측정하여 고품질의 병렬 코퍼스를 생산함.

상품화

2017년부터 적용

Sentence Category Classification

-수집한 텍스트 데이터의 카테고리를 분류하여 B2B 에서 요구하는 데이터를 제공하며, 카테고리를 늘리는 기능을 고도화하고 있음.

상품화

2018년부터 적용

음성 데이터 정제

-수집한 음성 데이터를 분석하여 품질을 수치화하고, 불필요한 부분은 제거하는 등 기계학습에 사용할 수 있도록 정제함.

상품화

2019년부터 적용

번역 API 제공-다양한 외부 서비스에서 연동해서 쓸 수 있도록 B2B 제휴 기업을 대상으로 번역 API 를 제공함. 매출 확대 및 텍스트 정제 기술 개발에 활용 가능.

상품화

2019년부터 적용



11. 해외진출

가. 해외진출의 동기 및 기대효과

인공지능 내 투입되는 언어데이터의 중요성에도 현재 전세계 시장 내 확고한 선도기업이 존재하지 않는 상황입니다. 이에 당사는 설립초기부터 국내시장이 아닌 글로벌 시장을 타겟으로 개발 및 플랫폼 운영을 영위하고 있습니다. 실제로 글로벌 IT기업들로부터 당사가 보유한 데이터에 대한 문의가 이어지는 과정에서, 당사는 국내의 한정된 시장이 아닌 글로벌 시장으로 진출을 목표로 하게 되었습니다. 특히 일반 제조업과 달리 당사가 영위하는 데이터 사업은 무형의 자산이라는 특성에 따라 별도의 생산설비가 요구되지 않을 뿐더라 재화의 이동 또한 요구되지 않습니다. 이에 전세계에 소재한 다양한 고객과의 거래를 통해 글로벌 시장 내에서 언어데이터의 선도적인 업체로 발돋움하고자 합니다.

당사는 기 설립된 중국과 일본 내 해외지사를 기반으로 해당 지역에 소재한 고객사들과의 협력을 강화하고 있으며, 이에 실제 매출 또한 매년 증가하고 있습니다. 이러한 경험을 바탕으로 미국 및 유럽내 추가적인 해외 지사 설립과 영업망 구축을 통해 더 많은 고객사를 확보하는 경우 당사는 글로벌 시장 내 경쟁력을 확보할 수 있을 것으로 기대하고 있습니다.

나. 해외진출의 연혁 및 그 내용

(1) 해외법인현황

당사는 내수시장뿐만 아니라 글로벌 시장에서 언어 데이터에 대한 수요가 증가하고 있기 때문에 Global Firm로의 도약을 위해 Target 지역을 중국 및 일본으로 선정하여 다음과 같이 순차적으로 진출하였으며, 현지 운영체계, 영업의 안정화 및 경쟁력 확보와 시장확대에 주력하고 있습니다.

구분

중국

일본

Flitto China (외자법인)

FanYiTong (내자법인)

Flitto Japan (자회사)

대표자

이정수

Henry Huang

Ryota Tomiyama

설립일

2016-06-27

2015-04-20

2018-07-18

결산기

12월

12월

12월

업종

서비스업

서비스업

서비스업

주요 제품/서비스

번역 서비스 및 자문

소프트웨어 서비스

번역 서비스 및 자문

주요 거래처

FanYiTong

Tencent, Baidu

NTT docomo

최대주주(지분율)

주식회사 플리토 (100%)

Henry Huang (100%)

주식회사 플리토 (100%)


(2) 주요활동사항

당사의 해외진출 연혁 및 성과는 아래와 같습니다.

일자

주요 연혁 및 실적

2015년 4월

플리토 중국 법인[FanYiTong (내자법인)] 설립

2016년 6월

플리토 중국 법인[Flitto China (외자법인)] 설립

2018년 5월

중국 지사 번역 서비스 품질경영시스템 국제표준 ISO9001 인증 획득

2018년 7월

플리토 일본 법인 설립

2018년 7월일본 번역연맹 가입


다. 향후 해외진출계획

당사는 2012년 8월 국내 법인 설립 이후 2015년 중국 법인, 2018년 일본 법인을 순차적으로 설립하였습니다. 당사의 언어 데이터 수요는 국내를 포함하여 미국, 일본, 중국 지역 내에서 매우 높기 때문에 현지에 법인이 있을 경우 원활한 커뮤니케이션 및 계약서 작성, 거래 대금 정산 등에서도 유리하다고 판단하였습니다. 실제 중국 법인 및 일본 법인 설립 이후 고객사들과 더욱 적극적인 논의가 가능해졌으며, 현지에서 상시 영업활동을 위한 창구로서 기능하고 있습니다.

다만 미국 및 유럽내에 소재한 고객사와의 논의는 여전히 많은 제약 내에서 거래가 이루어지고 있습니다. 특히 당사가 언어 데이터를 공급하고 있는 해외기업들의 상당수가 미국에 위치하고 있으며, 향후 거래를 희망하는 잠재적인 기업의 다수가 미국에있습니다. 이에 미국 및 유럽 내의 영업활동을 위한 거점으로서 해외지사를 추가 설치하고자 하며, 이는 현재 한국, 중국 및 일본의 동아시아 지역에 편중된 당사의 사업을 더욱 활발히 해줄 것으로 기대됩니다.


12. 그밖에 투자의사결정에 필요한 사항
당사의 지적재산권 보유현황은 다음과 같습니다.

번호

구분

내용

출원일

등록일

적용제품

출원국

1

특허

장문 번역 서비스 장치 및 방법

`14.12.12

`16.08.01

웹사이트 및 모바일 어플리케이션

대한민국

당사가 영위하는 사업은 효과적으로 조성된 플랫폼을 기반으로 하고 있습니다. 이에 향후 플랫폼의 기능 개선과 더불어 데이터 관련 기술의 추가 개발 등을 통해 당사의 기술경쟁력 확보에 노력을 기울일 예정입니다.




#


Comments