IT·프로그래밍

데이터 전처리·분석·시각화

댓글 및 문서의 LDA 토픽 모델링 시각 및 분석 료

Doorian 프로필 이미지
Doorian
연락 가능 시간 : 9시 ~ 18시
평균 응답 시간 : 2시간 이내
메인 이미지

서비스 설명

토픽 모델링은 문서의 집합에서 토픽을 찾아내는 프로세스를 말합니다. 이는 검색 엔진, 고객 민원 시스템 등과 같이 문서의 주제를 알아내는 일이 중요한 곳에서 사용됩니다. 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA)은 토픽 모델링의 대표적인 알고리즘입니다. 줄여서 LDA라고 합니다.



제공되는 내용은 다음과 같습니다


ㄱ. 응집성 검사 그래프 -> 응집성 검사 기반으로 주제를 나눕니다.

ㄴ. 단어 출현 빈도 막대 그래프

ㄷ. 토픽 수별 군집 png

ㄹ. 토픽 수별 군집 html

ㅁ. 등장 빈도 상위 단어(최대 20개)

ㅂ. 토픽별 주요 단어

ㅅ. 토픽별 관련도 높은 상위 10개 문서

ㅇ. 워드 클라우드(상위 50개 단어)


기본 가격은 5000문장(댓글, 짧은 문서)을 기준으로 진행되며, 1000문장 당 추가 비용 만 원이 있습니다.


서비스 제공 절차

토픽 모델링의 특성상, 의뢰자의 연구 목적에 따라 프로세스를 수정해야 합니다. 의뢰 기간 동안 지속적인 연락을 통해 진행될 예정입니다.


의뢰자분의 데이터 내용 확인 후, 의뢰 가능 및 불가 내용을 전달해 드리겠습니다.

의뢰인 준비사항

의뢰자 분께서 데이터 수집 및 전처리 후 의뢰를 주셔야 합니다.

(데이터 수집 의뢰는 현재 따로 받지 않고 있습니다. 전처리가 원할히 되지 않은 경우 연구 결과의 성능이 낮을 수 있습니다.)

기술 수준

중급:설계 / 코딩

팀 규모

1인

상주 여부

상주 불가능

개발 언어

HTML
JavaScript
Python
상세이미지-0

가격 정보

LDA 토픽 모델링을 통한 문서 분석

보유하신 데이터(댓글, 문장, 문서 등)로 LDA기반 토픽 모델링을 진행해 드립니다.

그래프 / 차트

4개

분석

1개

작업일

5일

수정 횟수

3회

전문가 정보

avatar
연락 가능 시간 : 9시 ~ 18시
평균 응답 시간 : 2시간 이내

총 작업개수

-

만족도

-

회원구분

개인회원

-프로그래밍 및 데이터 분석 -사업 계획서 작성 및 발표 -교육

수정 및 재진행

취소 및 환불 규정

자주 묻는 질문

잠재 디리클레 할당(Latent Dirichlet Allocation)이란 무엇인가요?

잠재 디리클레 할당은 단어가 특정 토픽에 존재할 확률과 문서에 특정 토픽이 존재할 확률을 결합확률로 추정하여 토픽을 추출하는 방법입니다.

추가 자료는 어떻게 의뢰하면 될까요?

유사 작업 결과물이 있는 논문을 첨부해 주시면, 최대한 의뢰자분께서 원하시는 데이터를 출력해 드리겠습니다.

상품정보고시

리뷰

아직 작성된 리뷰가 없어요.