본문 바로가기

분류 전체보기133

[이수안컴퓨터연구소] 문서 분류 Document Classification https://www.youtube.com/watch?v=xegxbgsnYko&list=PL7ZVZgsnLwEEoHQAElEPg7l7T6nt25I3N&index=4 https://colab.research.google.com/drive/1NlSZKwocO_9Z6Tbw7X4v9YsISHAZfJlK?usp=sharing _4 문서 분류(Document Classification).ipynb Colaboratory notebook colab.research.google.com 데이터 준비 문서 분류에 필요한 데이터는 scikit-learn이 제공하는 20개의 주제를 가지는 뉴스그룹 데이터를 사용 텍스트는 CounterVectorizer를 거쳐 DTM 행렬로 변환 DTM 은 문서에 등장하는 단어들을 빈도 수 별.. 2021. 8. 7.
[이수안컴퓨터연구소] 군집 분석 Cluster Analysis https://www.youtube.com/watch?v=YJSHBQj8zbU&list=PL7ZVZgsnLwEEoHQAElEPg7l7T6nt25I3N&index=3 군집 분석(Cluster Analysis) 군집 분석은 데이터의 특성에 따라 유사한 것끼리 묶음 유사성을 기반으로 군집을 분류하고, 군집에 따라 유형별 특징을 분석하는 기법 텍스트에 대한 군집 분석에서는 군집으로 묶여진 텍스트들끼리는 최대한 유사하고, 다른 군집으로 묶여진 텍스트들과는 최대한 유사하지 않도록 분류 텍스트 유사도 텍스트 쌍에 대한 자카드 유사도와 코사인 유사도 계산 자카드 유사도(Jaccard Similarity): 두 텍스트 문서 사이에 공통된 용어의 수와 해당 텍스트에 존재하는 총 고유 용어 수의 비율을 사용 코사인 유사도(.. 2021. 8. 4.
[이수안컴퓨터연구소] 키워드 분석 Keyword Analysis https://www.youtube.com/watch?v=5P6nG8xHKbU&list=PL7ZVZgsnLwEEoHQAElEPg7l7T6nt25I3N&index=2 https://colab.research.google.com/drive/1HdLLGVY-59yc8nMVdFdKRXrepxqcNcAD?usp=sharing#scrollTo=pvUu6DwlNLm9 _2 키워드 분석(Keyword Analysis).ipynb Colaboratory notebook colab.research.google.com 키워드 분석 - 핵심어(keyword)란 텍스트 자료의 중요한 내용을 압축적으로 제시하는 단어 또는 문구 - 핵심어 분석이란 불용어 제거와 어간추출 및 형태소 분석 등의 자연어 처리를 시행한 후 텍스트에서 많.. 2021. 8. 4.
[Do it! 구글 애널리틱스 입문] 1장. 데이터 분석과 구글 애널리틱스 01-1 측정이 없으면 개선도 없다 - 트래픽 vs 목표 기존에는 트래픽 (얼마나 많이 방문했는가) 가 데이터 분석의 중심. 구글 애널리틱스는 트래픽이 아닌, 목표를 중심으로 분석. 여기서 목표란? 사이트에 따라서 다르겠지만, 일반적인 쇼핑몰의 경우 구매. 이러한 목표 달성을 GA에서는 '전환'이라고 부름. - 데이터는 답을 알고 있다 마케팅이란, 구매자를 늘리는 것. 그런데 누구에게 어떻게 마케팅할 것인가? -> 데이터가 답을 알고 있다! - 990명은 어디서, 왜 사라졌을까? 퍼널 모형이란, 방문에서 구매로 이어지는 여정을 나타낸 것. 입구는 넓고 출구는 좁은 깔때기. 여기서 입구는 방문, 출구는 구매라고 볼 수 있고, 출구로 나가지 않은 방문자들은 중간에 이탈하는 것. 핵심은, 이탈을 만드는 부정적.. 2021. 8. 4.
[DevOpsArt] DevOps 는 무엇인가요? 현직 DevOps 엔지니어, AWS Hero 가 이야기하는 DevOps 이 정확한 의미. DevOps 는 무엇인가요? 현직 DevOps 엔지니어, AWS Hero 가 이야기하는 DevOps 이 정확한 의미. - YouTube 2021. 8. 4.
210731 [스페셜리포트]④ 클라우드 서비스 필수 요소된 서비스형 머신러닝 MLaaS...빅테크가 리드 [스페셜리포트]④ 클라우드 서비스 필수 요소된 서비스형 머신러닝 MLaaS...빅테크가 리드 < 테크 < 기사본문 - AI타임스 (aitimes.com) [스페셜리포트]④ 클라우드 서비스 필수 요소된 서비스형 머신러닝 MLaaS...빅테크가 리드 - AI타임 [편집자주] 클라우드는 구름이 아니다. 그러나 구름보다도 더 전 세계를 덮고 있는 서버의 구름떼 같다. 이제 클라우드가 없으면 전 세계의 산업이 돌아가지 않을 정도가 됐다고 해도 과언이 아 www.aitimes.com - MLaaS 서비스 대표격인 아마존 세이지메이커, 60여개 기능 탑재 - 인터페이스가 장점인 MS·5월 통합 플랫폼 출시한 구글 - 국내 시장은 태동기...네이버 중심으로 AI API 서비스 시작 [편집자주] 클라우드는 구름이 아니다.. 2021. 8. 2.