홈 > 제품소개 > 인포플러스  
 
 
 
InfoPlus는 개방적이고 확장 가능한 텍스트 마이닝 프레임워크를 제공하는 엔터프라이즈 솔루션이다.

기업 내부의 IT 프레임워크 또는 BI 플랫폼과 통합하여 비정형 텍스트 분석을 지원할 수 있고 웹에 있는 수많은 블로그, 게시판, 포럼같은 가치있는 비정형 텍스트 데이터를 분석하여 숨겨져 있는 유용한 정보를 추출하여 제공할 수 있다.

제품에 대한 사용 후기 분석, 클레임 분석, 설문지 분석, 환자 정보 분석등 텍스트 정보가 있는 곳이면 InfoPlus 솔루션이 적용될 수 있으며 모든 결과는 XML로 생성되어 XML 변화 툴과 텍스트 마이닝 API를 응용하면 기존의 시스템과 통합하여 다양한 서비스를 제공할 수 있다.

 
 
   
→  비정형 지식 문서의 특징을 수집하여 사전을 구축하는 도구이다.  
     
자연어 처리 기술과 문서 처리 기술에 기반한 알고리즘이 탑재되어 문서의 정보를 분석하고 텍스트 마이닝에 사용될 사전을 구축합니다.  
사전은 명사, 용언, 불용어, 구, 시소러스로 구분되고 특징을 추출하는 데 사용됩니다.  
 
→ 
비정형 지식 문서의 정보를 발굴하기 위해 문서의 특징을 선택/수집하여 정보를 추출하는 도구이다.
 
     
비정형 지식 문서를 분석하기 위해 문서의 유전자에 해당하는 특징의 추출  
다양한 알고리즘과 사용자의 요구에 의해 마이닝에 필요한 특징의 선택  
선택된 특징들의 문서와의 연관 값을 계산하여 특징을 표현  
특징의 분포를 정규화  
 
→ 
추출된 비정형 지식 문서의 특징 정보에 텍스트 마이닝 알고리즘을 적용하여 지식 정보를 발굴(Mining)하는 도구이다.
 
     
특징 정보들의 유사성을 예측하지 않고 수량적으로 계산하여 속성이 비슷한그룹을 만들어 가는 군집 분석 컴포넌트  
일정한 표준 분류 체계에 특징 정보와의 유사성을 계산하여 자동으로 문서를 분류하는 학습 분류기를 내장한 분류 분석 컴포넌트  
키워드 및 다양한 패턴 형식을 사용하여 문서의 내용 및 유사성 검색을 하는 문서 검색 컴포넌트  
특징들 혹은 문서들 간의 관계를 살펴보고 이로부터 유용한 규칙을 찾아내는 연관 관계 분석 컴포넌트  
 
→  비정형 지식 문서로부터 정규표현식을 사용하여 어떤 문자열을 검색(Search)하거나 치환(Replace), 문자열 패턴을 추출(Extraction) 하는 도구이다.  
     
     
     
 
 
우리 주위에는 무수한 텍스트 자료들이 존재한다.

개인 사용자는 웹의 발달로 블로그, 카페, 게시판 등을 통하여 자신의 의견을 공개하고 있고 기업에는 문서관리시스템, 데이터베이스 서버, 파일 서버, FTP 서버 등에 기업에 필요한 데이터를 관리하고 있다.
이러한 많은 데이터 소스에서 많은 부문이 텍스트 정보지만 텍스트의 한계로 인해 많은 어려움이 존재했다.

InfoPlus에서는 웹에 있는 정보나 기업에 존재하는 많은 텍스트 정보를 수집할 수 있는 커넥터를 제공하여 사용자가 쉽게 텍스트 정보에 접근할 수 있도록 지원한다.

 
 
 
InfoPlus에서 제공되는 커넥터를 사용하여 수집된 텍스트 정보는 HTML, XML, 바이너리 문서 파일등 직접 텍스트 분석을 할 수 있는 상태가 아니다.

사용자는 분석하고자 원하는 텍스트 정보만을 선택하여 TXT 파일로 변환하여 분석해야 한다.
블로그, 게시판, 포럼에서 가져온 데이터는 HTML 형식으로 되어 있어 태그를 삭제하고 원하는 텍스트 데이터만을 추출해야 하고 PDF, HWP, DOC, XLS, PPT 등 바이너리 문서화일은 3rd party 텍스트 변환 툴을 이용하거나 사용자가 직접 C# 프로그램을 작성하여 TXT 파일로 변환해야 한다.

데이터베이스에 있는 텍스트 정보는 필드를 지정하여 텍스트로 추출한다.
이렇게 TXT 파일로 변환된 비정형 텍스트 정보에서 사람, 시간, 장소 같은 특징 정보를 추출하여 데이터웨어하우스에 정형화된 정보로 저장할 수 있다.

기업에서는 기존의 데이터베이스 정보와 텍스트 정보를 함께 활용하여 더욱더 효율적인 정보 관리를 할 수 있게 된다

 
 
 
수집된 텍스트 데이터는 사전관리자, 특징관리자, 텍스트마이닝관리자 등의 InfoPlus 텍스트 정보 분석 툴을 사용하여 분석을 진행하게 된다. 텍스트 정보 분석은 특징 벡터에 기반한 군집분석, 분류분석, 관계분석과 룰에 기반한 텍사노미분석, 다차원분석, 연관분석, 통계분석등 다양한 분석 방법을 제공한다.

InfoPlus 제품군은 닷넷 프레임워크 환경에서 개발되었으며 InfoPlus 제품군에 사용되는 모든 데이터는 XML에 기반하고 결과 역시 XML로 생성되어 XML 변화 툴과 텍스트 마이닝 API를 응용하면 기존의 시스템과 통합하여 다양한 서비스를 제공할 수 있다.

 
 
→ 
추출된 비정형 지식 문서의 특징 정보에 텍스트 마이닝 알고리즘을 적용하여 지식 정보를 발굴(Mining)하는 도구이다.
 
     
제품 피드백 정보 분석  
고객 불만 사항 분석  
맞춤형 마케팅을 위한 고객 정보 분석  
자유롭게 기입 가능한 설문지 분석  
환자 정보 분석  
범죄 유형 분석  
고객 불만을 초기에 찾아 알릴 수 있는 경고 서비스  
특징 정보 추출 서비스  
 
→ 
숨겨진 트렌드와 이슈 추출
 
조기경고, 위험방지, 원가절감 등을 위한 중요한 트렌드나 이슈분석  
이상한 행동 및 사기의 신속한 판단으로 조사 시간 단축 및 결과 향상  
모든 가능한 정보를 분석하여 조사의 정확도 향상  
     
→  제품과 서비스 만족도 향상  
제품 피드백에 대한 신속한 이해와 처리 가능  
제품에 대한 문제 영역의 정확한 설정  
제품 요구사항과 제품 향상을 지원  
     
→  신속한 의사 결정 가능  
수작업과 시간이 많이 소비되는 분석 방법에서 자동화와 신속한 분석방법으로 전환하여 더욱더 효율적인 비즈니스 프로세스 정립  
기존 시스템과 통합을 위한 신속한 커스터마이징 제공  
     
→  고객 분석  
고객 유지를 위한 고객 니즈 파악에 도움  
고객의 피드백 파악하는 시간 절감  
고객 마케팅 효율성 증대에 도움