Projects/project2
[2차 프로젝트] 추후 보완할 점
codingmemory
2022. 9. 29. 00:46
데이터 기반의 인사이트를 창출하고 싶다는 목표를 바탕으로 보완점을 보완하고자 한다
1. 기획 배경
- 2020년 대비 2021년 와인 수요 70% 증대
- But, 와인 초심자들은 여전히 어떤 와인을 골라야 할지 접근하기 어려워한다는 배경을 바탕으로 프로젝트 시작
- 와인 대화형 추천 챗봇의 부재
-> 1인 와이너리 체제가 많아 실시간 고객 응대 어려움, 온라인 응대 어려움 (보통 카카오톡 채널로 홍보진행)
->이달의 추천, md 픽 등 대중적인 추천이 이루어짐
솔루션 목표: 좀 더 개인화된 취향에 맞는 와인을 추천해줌으로써 어려움 해소 및 와이너리 판매 촉진의 효과 거두고자 함
2. 보완하고 싶은 점
주관적인 인사이트 근거로 프로젝트 시작한 것 같아 -> 수치적인 근거 , 데이터 기반으로 문제를 발견하고 프로젝트를 시작했어야 했음
-> 와인 초심자들이 와인 고르는 것 어려워한다 (네이버 블로그 크롤링으로 자주 등장하는 단어 추출해서 확인가능)
3. 계획
크롤링 데이터는 감정(긍정/부정) 분류 안 되어져 있어 label을 붙이거나 비지도 학습으로 긍정/부정 유추
유사한 블로그 내용끼리 문서 군집화를 실행하여 핵심 단어를 추출할 수 있겠음
※ 추후 최종 목표: 문서군집화 ( 네이버 크롤링 데이터 프레임) -> 핵심 피처, 긍/부정, 빈번 단어 추출
예시 (실제 데이터로 활용하는 것이 어려워 파이썬 머신러닝 완벽 가이드 교재를 통해 먼저 진행 과정을 익히는 것 시도)
파일 (데이터 ) 불러오기
핵심 문자만 가져올 수 있도록 전처리
※ 이를 바탕으로 실 데이터를 적용해 객관성 실어볼 것
반응형