- 다양한 주제에 대해 자유롭게 글을 작성하는 게시판입니다.
Date | 19/12/28 15:51:51수정됨 |
Name | 홍차드립되나요 |
Link #1 | https://korpus.junheecho.com/ |
Subject | '한국어 자연어처리 데이터 수집'에 관련하여 글 남깁니다. |
문제시 글 삭제하도록 하겠습니다. 저희는 일상생활에서 발생하는 ‘한글’로 쓰여진 맞춤법과 문법 오류를 줄일 수 있는 인공지능 모델을 연구하는 팀 DeepNLP입니다. 한글을 강조한 이유는 영문에 대한 인공지능 연구에 비해 연구 데이터가 턱 없이 적기 때문입니다. 영어를 쓰는 인구와 한글을 쓰는 인구를 비교하면 너무나 당연하지만... 그럼에도 불구하고 적어도 너무 적어요. 자연어처리 연구를 하기 위해 가장 기본이 되는 것이 데이터인데… 연구와 마찬가지로 한글 데이터는 너무 적거나 오래된 것들이 많아 사용할 수 있는 데이터가 영어에 비해 현격히 적은 실정입니다. 그래서 저희는 홍차넷 회원님들에게 도움을 요청 드리고자 합니다. 저희 연구팀은 인공지능 기반 한국어 맞춤법 검사기를 개발하는 프로젝트를 위해 한국어를 모국어로 사용하는 사람의 자연스러운 언어 습관에 따라 (어법 오류가 포함된) 문장을 연구 및 비상업적 목적으로 수집하고 있습니다. 여러분의 하나하나의 기여가 큰 도움이 될 것입니다. 연구에 기여하시는 방법은, 아래 페이지에서 들어가서 재생되는 문장을 편하게 받아 적어주시면 됩니다. 도와주신 분들의 노력에 보답하고자 참여해주시는 분들의 닉네임은 사이트에 명시하고, 연구 결과와 이 데이터는 오픈소스로 배포하도록 하겠습니다. 그리고, 감사의 표시로 작지만 참가자 20분께 추첨을 통해 스타벅스 기프티콘을 보내드립니다 :) (기프티콘은 1월 30일에 참가자의 이메일로 통해 발송됩니다.) 많은 참여와 함께 홍보 부탁드립니다. 감사합니다. 연구 참여하기 : (링크) 3
이 게시판에 등록된 홍차드립되나요님의 최근 게시물 |