본문 바로가기

뉴스스크랩

솔트룩스, 차세대 LLM 루시아2 공개…'구버'도 내달 한미 동시 출시

솔트룩스, 차세대 LLM 루시아2 공개…'구버'도 내달 한미 동시 출시

김지영 기자 입력 2024.05.30 11:23댓글 쓰기    


루시아2부터 생활밀착형 서비스까지 대거 선보여

[아이뉴스24 김지영 기자] 인공지능 기업 솔트룩스는 ‘Saltlux AI Conference(이하 SAC 2024)’를 강남 GS타워에서 성황리에 개최했다고 30일 밝혔다.

                            솔트룩스가 30일 오전 서울 강남구 역삼동에서 SAC2024를 개최했다. [사진=솔트룩스]

 

올해로 18회째를 맞는 이번 컨퍼런스의 주제는 ‘GenAI 오디세이 - 증강인류시대의 서막’으로, 다이퀘스트뿐 아니라 플루닛, 구버 등 그룹사 전체가 참여해 AI 기술과 서비스를 대거 선보이고 미래 청사진을 구체화했다.

이날 집중 조명된 것은 이미 유수의 기업에서 실증 사업이 이루어지고 있는 거대언어모델 ‘루시아’의 차세대 모델 ‘루시아2(LUXIA2)’다.

루시아2는 더 많은 사전학습 코퍼스와 인스트럭션 데이터를 학습했으며, 한 번에 이해할 수 있는 입력 토큰 길이도 6만 4천 토큰 수준으로 무려 30배 이상 확장됐다. 토크나이저 효율성도 상향되어 한국어 생성 속도는 라마3(Llama3) 대비 약 18% 이상 향상됐으며, 비용은 감소했다. 또한, 학습한 지식을 부분적으로 편집함으로써 보유 지식의 품질을 유지할 수 있으며, 지식 편집 성능은 88.4% 수준이다.

 

RAG(검색증강생성)와 연계되는 에이전트 루시아·루시아 임베딩 기능도 더 강력해졌다. 에이전트 루시아는 능동적으로 검색 전략을 수립하고 실행해 검색 성능을 극대화한다. 문서를 벡터화하는 데 사용되는 루시아 임베딩은 오픈AI의 임베딩 모델과 비교했을 때, 한국어 검색에서는 18.75%, 한국어-영어 교차 검색에서는 15.62% 향상된 정확도를 보였다. 김재은 연구소장은 루시아의 올해 목표를 백만 명 이상의 일 사용자 확보와 100개 이상 상용서비스 적용으로 설정하고, 사업화에 총력을 기울이겠다고 말했다.

정보 유출 우려와 도입 비용을 최소화한 세계 최초의 생성 AI 어플라이언스 ‘루시아 온’, 인공지능 두뇌가 전 세계 웹에서 사용자 맞춤형 정보를 실시간 추천하고 심층 리포트까지 자동 생성하는 차세대 인공지능 에이전트 서비스 '구버(Goover)'도 소개됐다. 내달 한국과 미국에서 동시 출시되는 구버는 최근 구글의 경쟁자로 주목받은 퍼블렉시티를 넘어 가장 진보한 경험을 사용자에게 제공할 것이라고 조슈아배 솔트룩스 미국 법인장은 강조했다.

이외에도 영상과 음악 등 모든 종류의 콘텐츠를 생성할 수 있는 ‘플루닛 스튜디오 2.0’를 비롯해 ‘워크센터’, ‘손비서’, ‘미미콘’, ‘서치 스튜디오’, ‘마리너’, ‘인포채터’ 등 다양한 생활밀착형 AI 서비스들이 대거 공개됐다. 솔트룩스는 의료, 보험, 금융 등 각 산업 분야에 조성한 협력 네트워크를 토대로 기술·서비스를 빠르게 확장해 나갈 예정이다.

믿을 수 있는 인공지능 개발과 디지털 질서 조성을 위해서도 앞장선다. 솔트룩스는 안전한 AI 기술과 서비스 개발을 목표로 정부(과학기술정보통신부)·서울대, 카이스트 등과 함께 세계적인 경쟁력을 갖춘 협력체를 구성하고 공동 연구를 시작했다. 또한 법적 안전성의 확보와 글로벌 서비스 경쟁력 강화를 위해 국내외 유수 법률 로펌과도 대규모 AI 사업을 시작할 계획이다.

키노트에서 이경일 솔트룩스 대표는 “인공지능이 더 큰 영향력을 가지게 될 때 위해 인공지능 기업의 사회적 책임을 다하고자 아낌없이 노력할 것”이라며 “솔트룩스의 존재 사명이기도 한 ‘세상 사람들이 자유롭게 지식 소통하는 세상’을 실제로 만들고자 하며, 그 자리에 여러분과 함께 하도록 하겠다.”라고 말했다.

컨퍼런스 영상은 추후 솔트룩스 공식 유튜브에서 다시 시청할 수 있다.

/김지영 기자(jy1008@inews24.com)

 

아이뉴스24

e하루의 시작! - 산업, 경제, IT, 정치, 사회, 문화, 연예, 스포츠, 포토 등 종합뉴스 제공

inews24.com

 

 

---------------------------------------------------------------------------------------------------------------------------------

 

사업의 개요


(1) 성장 과정
기술 검증ㆍ상용화기 (2004년~2011년) :솔트룩스는 2003년 자연어 처리 전문기업 '시스메타'와 다국어처리 전문기업 '모비코인터내셔널'이 합병되어 설립되었습니다. 2005년부터 지식공학과 지식그래프 및 추론 기술에 대한 연구를 시작하였고, 2006년 기업명을 ㈜솔트룩스로 변경하였습니다. 자연어 부문 원천 기술을 검색과 저장, 추론 부문으로 전개해 나갔습니다. 당사는 인공지능 학습에 필요한 데이터 규모가 커지면서 '병렬분산 검색' 등의 솔루션출시를 통해 상용기술의 선도성을 인정받았습니다.

제품 고도화기(2012년~2015년) : 심층 질의응답(Deep QA)은 대화형 인공지능의 핵심 기술로서, 사전에 정의된 시나리오가 아닌 질문에 대해서도 사람의 말과 글을 이해해 의미분석 및 추론(reasoning)을 통해 답을 제시할 수 있도록 돕습니다. 이처럼 기계가 지속해서 방대한 데이터를 학습하고 문제해결에 필요한 지식을 증강하는 기술은 솔트룩스의 핵심 경쟁력으로 인정받고 있습니다.

신성장기 (2016년~2024년) : 2016년 알파고/딥마인드를 통해 인공지능에 대한 관심이 폭발적으로 증가했습니다. 또한 기업의 IT시스템이 클라우드로 빠르게 전환되는 국면에 더해, 당사는 창업 이래 기술검증 및 상용화, 제품 고도화를 통해 확보한 선도적 사업기반을 인공지능 사업과 빅데이터, 클라우드 서비스(AIaaS)를 중심으로 전개하면서 새로운 성장 국면에 진입하였습니다. 당사는 지난 성장 과정에서 10년 간 축적된 초대규모 언어 및 음성 데이터 자산과 아시아 최대 규모의 독보적 지식베이스를 통해 초거대 언어모델 '루시아(LUXIA)'를 개발 하였습니다. 200억 건 이상의 지식베이스, 700만 언어 말뭉치, 3만 시간 이상의 고품질 음성 데이터는 생성 AI, 특화된 분야의 심층 질의응답, AI 상담비서, 가상인간 등의 AI 서비스 분야에 활용되어 전 국민 누구나 사용할 수 있습니다.  

(2) 사업분야

엔터프라이즈 AI 고객의 문제를 빠르게 해결하고 초격차 기업으로의 혁신성장을 위한 사업
고객 응대 또는 사내 인사와 업무용 챗봇 뿐 아니라 중요 의사 결정을 지원하는 대규모 데이터 수집과 예측, 실시간 시장 및 경쟁자 분석, 고객 목소리 이해에 이르기까지다양한 솔루션을 제공하고 있습니다.
디지털플랫폼정부 정부와 국민이 하나로 연결되는 세계 최고의 디지털플랫폼정부 구현 사업
업계 1위 기술력과 입증된 사업 수행력을 기반으로 공공 플랫폼 구축, 사업 컨설팅과 기획, 시스템 유지관리에 이르기까지 다양한 대규모 국가 사업을 200회 이상 수행하여 대한민국의 플랫폼화와 지능화를 주도하는 대표 인공지능 기업이 되었습니다.
금융서비스 지능화  금융산업의 디지털 전환을 넘어 AI로의 전환을 위한 사업
금융 기관의 고객센터 지능화(AICC)를 위한 챗봇과 콜봇은 물론, 금융 지식관리와 의사 결정을 위한 대규모 데이터 분석체계 , 기업 리스크를 예방하기 위한 차주 부도, 부실 예측 등 기존 업무와 인프라의 혁신을 위한 다양한 인공지능 솔루션을 제공해 왔습니다.
AI 컨택센터(AICC) 고객에게 빠르고 정확한 정보를, 상담원에겐 최적의 업무환경을 제공하기 위한 사업
솔트룩스의 AI 컨택사업은 전화, 라이브챗, 카카오 등 다양한 상담채널을 통해 유입되는 고객 문의와 요청 응대를 자동화하고 AI를 통해 상담원들의 활동을 지원함으로 비용 절감을 넘어 고객 충성도 향상과 브랜드 가치를 극대화하는데 기여하고 있습니다. 
공공안전과 국방 대한민국 국민의 안전과 국가의 방위를 위한 사업
사회가 발전하고 평화가 유지될수록 공공안전과 국방력 강화는 국가의 더욱 중요한 역할이 되고 있습니다. 더불어 첨단 국방과 시민친화적 공공안전에서 데이터 분석과 지능화는 거부할 수 없는 필수적 요소가 되었습니다. 솔트룩스는 10년 이상 대규모 국방사업과 공공안전 부문에서 중요한 역할을 해왔으며, 지금은 이 분야의 디지털 전환을 넘어 지능화를 위한 핵심 파트너가 되었습니다.
AI 학습데이터 구축
및 모델링 
데이터 지능화를 통한 데이터의 무한 가치 창출을 위한 사업
솔트룩스는 대한민국 최초의 인공지능 전문기업이자 상장기업으로써 자연언어처리, 음성인식, 얼굴을 포함한 다양한 영상인지와 의료, 바이오 분야에 이르기까지 초대규모 학습용 데이터의 구축과 기계학습 모델 최적화 사업을 추진해 왔습니다. 자동화된 구축 프로세스와 구축 도구 및 품질 검수 체계를 보유하고 있으며, 국내 및 해외 자회사에 학습데이터 구축과 모델링 전담 조직을 보유하고 있습니다.

 

거대언어모델 (LUXIA, 루시아)
솔트룩스 거대언어모델 'LUXIA(루시아)'는 책 420만권 분량, 텍스트 기준 2TB 이상의 데이터를 학습했습니다. 루시아의 특장점은 다음과 같습니다.

 

- 루시아는 전 세계 언어모델들을 평가하는 허깅페이스(Hugging Face)의 오픈리더보드에서 지난 24년 3월 14일 기준으로 1위를 달성했습니다. 루시아의 이번 성과는 35B 이하 언어모델들 사이에서 확보한 순위로, 평균 점수는 약 77.74점입니다. 전체 초거대 모델들을 기준으로도 피라미터 50B 이상의 대규모 모델들을 제치고 전 세계 4위를 달성, 적은 피라미터로도 상위 모델보다 뛰어난 능력을 보여주는 압도적 성능뿐 아니라 경제성까지 입증했다는 평가를 받았습니다. 

특히 테스트 점수는 '상식능력(HellaSwag) 91.88점'과 '추론능력(ARC) 77.47점'을 받았으며, 최근까지 허깅페이스에서 82,700회 이상 다운로드가 되었습니다.


- 루시아는 크게 3가지 판매 방식으로 시장에 공급됩니다. ▲기업 내부 서버에 설치되는 구축형(온프레미스) 사업, ▲하드웨어 내 언어모델을 탑재한 어플라이언스 형태의 '루시아온(LUXIA-ON)', ▲클라우드 서버(아마존 AWS)에서 도메인 특화된 '법률, 특허, 교육, 금융' 언어모델을 사용할 수 있습니다.

- 전 세계 최초로 시장에 공급한 '루시아온'은 다음과 같은 특장점이 있습니다.
* 루시아(LUXIA) 뿐만 아니라 ChatGPT와 연계해서 사용할 수 있습니다. Llama2와 Mistral 등 다양한 오픈모델들과의 연동이 가능합니다.
* 쉽게 사용하고 테스트할 수 있도록 채팅 UI를 기본적으로 제공합니다.
* 검색 엔진과 벡터 DB가 내장되어 있어 RAG를 수행할 수 있습니다. RAG를 통해 최신 데이터를 연계할 수 있고 할루시네이션을 감소시킬 수 있습니다.
* 웹 관리도구를 통해 쉽게 전체 시스템과 모델을 관리하고 모니터링할 수 있습니다.
* 파일 관리자를 통해 폴더 생성 및 문서 관리가 가능합니다.
* 새로 릴리즈되는 모델들을 쉽게 다운로드 받아 적용할 수 있습니다.
* 파인튜닝(Quantization, LoRA)을 통해 다양한 Use Case에 대응하는 나만의 LLM을 만들 수 있습니다.

 

21년 매출액 268억, 303억, 308억 2024년 기대 매출 570억 

영업이익이 딱 1번 2023년 4분기만 + 이고 나머지는 모두 -  ㅠㅠ

대화형 인공지능, 증강분석 빅데이터 사업 및 인공지능 클라우드 서비스 분야의 사업전개.

ICC SaaS 사업, 초기앤화 AI 서비스, AI 기반 유전체 분석 및 신약사업, 메타휴먼 사업의 신규사업 추진 중...

 

루시아2를 공개했는데도 주가가 꿈쩍도 안 한다.  2023,9월 49000원 찍고 계속 내리막이다. 

 

우리나라에도 거대언어모델이 있는 줄 이번에 처음 알았다.