스팀잇 글 분류하기 (첫번째 시도)

스팀잇을 처음 시작했을 때부터 게시글을 카테고리별로 분류하고 싶었습니다. 머신러닝을 이용해서 하고 싶었던 프로젝트 중의 하나였어요. 그런데 머신러닝이 어려워서 한동안 손을 놓고 있었네요. 요즘은 머신러닝보다 리액트의 매력에 빠져서 리액트 코딩 영상과 문서만 보고 있습니다. ㅎㅎ 제가 머신러닝을 경험하면서 배운 점은 코딩과 머신러닝은 다른 세계라는 것입니다....

Read

텐서플로우(TensorFlow) Char-RNN를 이용하여 소설 쓰기

텐서플로우를 사용하여 소설를 쓰는 인공지능을 구현해보았습니다. 원래는 감성적인 시를 쓰는 인공지능을 구현해보고 싶었습니다. 그런데 학습 데이터 구하는게 쉽지 않네요. 참고로 머신러닝 텍스트 생성은 이전에 마르코프 체인(Markov Chain)에서도 한 번 다룬 적이 있습니다. 사실 깃허브에 공개된 오픈소스를 그대로 사용하였습니다. sherjilozair님이...

Read

파이썬 머신러닝 #8 - 마르코프 체인(Markov Chain) : 문장 생성하기

마르코프 체인은 챗봇 답변과 같은 문장생성에 많이 사용됩니다. 더 나아가 딥러닝을 이용하면 셰익스피어 소설을 쓴다거나 소스코드도 만들어 낼 수 있습니다. RNN을 사용하여 셰익스피어나 리눅스 소스 코드를 생성하는 내용은 아래 앤드류 응 교수님 블로그에서 볼 수 있습니다. RNN/LSTM에 관한 내용입니다. The Unreasonable Effectiv...

Read

파이썬 머신러닝 #7 - 문서 요약하기(TextRank Summariser)

Summary by Nick Youngson CC BY-SA 3.0 ImageCreator 안녕하세요. @anpigon입니다. 파이썬을 이용하여 문서를 쉽게 요약할 수 있는 기능을 소개합니다. 이 글은 summarization.summarizer – TextRank Summariser을 참고하여 작성한 글입니다. gensim, newspaper 모듈 설치...

Read

네이버 API를 이용한 얼굴 인식하기 - 닮은 유명인 찾기

안녕하세요. @anpigon입니다. 최근에 @codingart님의 OpenCV를 이용한 얼굴 인식 시리즈를 읽고나서 얼굴 인식에 관심이 생겼습니다. OpenCV로 얼굴인식 구현하는게 어려워서 인터넷을 찾아봤는데, 네이버에서 얼굴 인식 API를 제공하는 것을 알게 되었습니다. 네이버 Clova Face Recognition API를 이용해서 얼굴인식 하는 것...

Read

파이썬 머신러닝 #6 - 스팀잇에서 유사한 게시물 찾기

안녕하세요. @anpigon입니다. @nhj12311님의 Node & Steem #11 - 글 아카이브 ... 포스팅 분류하기 게시글을 보고 저도 비슷하게 구현해보았습니다. 시리즈 글을 찾아주는 기능은 @nhj12311님이 완벽하게 구현하였더군요. 그래서 저는 @nhj12311님과 다르게 시리즈 글이 아닌 유사도가 높은 게시글을 찾아내는데 초점을 맞추었습니...

Read

파이썬 머신러닝 #5 - 유사한 게시물 찾기

안녕하세요. @anpigon 입니다. 이번에는 유사한 게시물을 찾아내는 방법을 공부하였습니다. 게시물을 벡터로 계산하고, 벡터 간의 거리를 구하는 방법으로 유사도를 분석합니다. 이 기술을 이용하면 인터레스팀 서비스처럼 관련 글을 찾아낼 수도 있습니다. 저는 이 기술을 사용해서 불펌러(어뷰징 계정)들을 찾아내고 싶네요. 이번 예제는 Building Machi...

Read

파이썬 머신러닝 #4 - 스팀잇 글 감정 분류하기

안녕하세요. @anpigon 입니다. 이번에는 간단한 텍스트 감정 분류기를 만들어 보겠습니다. 참고로 구글 검색하면 파이썬 머신러닝 관련 자료가 넘치도록 많습니다. 구글에서 마음에 드는 예제를 하나 가져왔습니다. 아래 예제는 -text-classification/를 참고 했습니다. TextBlob 라이브러리 설치 Textblob는 텍스트 정보를 처리하는 파...

Read

파이썬 머신러닝 #3 - 스팀잇 아이디로 성별 예측하기

안녕하세요. @anpigon 입니다. 이전에 파이썬 형태소 분석이란 제목으로 시리즈를 시작했는데, 시리즈 제목을 머신러닝으로 변경했습니다. 형태소 분석은 스팀잇에 작성한 글로 단어구름를 만들어보고 싶어서 시작했습니다. 하지만, 형태소 분석만 하고 끝내기엔 아쉬워 머신러닝을 공부해서 재미난 걸 만들어 보려고 합니다. 이번에는 머신러닝을 사용하여 스팀잇 아이디...

Read

파이썬으로 스팀잇 형태소 분석하기 #2 - 단어구름 만들기

안녕하세요. @anpigon 입니다. 이전 글에 이어서 이번에는 스팀잇에 작성한 글에서 단어를 추출하여 단어구름을 만들어 보겠습니다. 이전글 파이썬으로 스팀잇 형태소 분석하기 #1 워드클라우드 모듈 설치 워드클라우드(wordcloud) 모듈을 설치한다. pip install wordcloud 워드클라우드 깃허브에서 사용방법 또는 예제 소스를 참고할 수...

Read

파이썬으로 스팀잇 형태소 분석하기 #1

안녕하세요. @anpigon 입니다. 구글 Keynote (Google I/O '18) 발표 영상을 이제서야 봤습니다. 발표 내용은 구글 어시스턴트의 새로운 기능에 관한 내용입니다. 여기서 주목할 기능은 인공지능(AI)이 미용실이나 레스토랑에 전화를 걸어 예약을 해주는 기능입니다. 인공지능이 미용실에 직접 전화를 걸어 대화하면서 예약하는 장면은 소름 돋을...

Read