- 질문 게시판입니다.
Date | 19/11/06 16:10:32 |
Name | SCV |
Subject | 프로그램/시스템 개발 문의 |
안녕하세요. 일을 하다보니 자연어 처리(?) 에 대한 니즈가 생겨서... 음.. 구체적으로는 특정 문서를 텍스트로 넣으면 그 문서가 일정한 규칙을 잘 따르고 있는지 파악해서 검토해 주는 프로그럄을 만들어보고 싶습니다. 일종의 맞춤법 검사기 비슷한건데요... 이런 프로그램? 시스템? 을 만드려면 어떤 언어로 어떻게 만들면 가능할지에 대해서 고견 부탁드립니다. 음... 목표하는 시스템은 appspot 에 얹어져 있네요. 0
이 게시판에 등록된 SCV님의 최근 게시물
|
잘은 모르지만 https://stanfordnlp.github.io/CoreNLP/ 요런거 찾으시는걸까요 java로 만들어졌다고합니다
바닥부터 개발하시는건 비추입니다
https://github.com/datanada/Awesome-Korean-NLP
여기서 운영하시는 서비스가 올려진 플랫폼과 호환가능하면서 원하는 기능이 비슷하게 되어있는것 찾아서 튜닝하시는게 빠르실듯 합니다
https://github.com/datanada/Awesome-Korean-NLP
여기서 운영하시는 서비스가 올려진 플랫폼과 호환가능하면서 원하는 기능이 비슷하게 되어있는것 찾아서 튜닝하시는게 빠르실듯 합니다
자연어 분석으로 하려고해도, 형태소 정보로 위와 같은 고레벨 정보 추적은 어렵습니다. 로직짜다 세월 갑니다.
제 짧은 식견으로는, 언급하신 건들은 대부분 정규식표현으로 처리 가능할거 같으니 직접 짜보시는게 좋을 것 같네요.
언어는 아무래도 좋을것 같고, 입출력을 웹으로 할건지 파일로 할건지만 결정하셔요.
웹이 텍스트 특성상 (파일 처리 안해도되서) 더 간단할수도 있겠네요.
1. 특정 단어가 반복되는지, (특정단어 지정할 경우 가능)
2. 특정 단어 뒤에 나오는 단어가 그 이전 문맥에서 등장하는지, (특정단어 지정할 경... 더 보기
제 짧은 식견으로는, 언급하신 건들은 대부분 정규식표현으로 처리 가능할거 같으니 직접 짜보시는게 좋을 것 같네요.
언어는 아무래도 좋을것 같고, 입출력을 웹으로 할건지 파일로 할건지만 결정하셔요.
웹이 텍스트 특성상 (파일 처리 안해도되서) 더 간단할수도 있겠네요.
1. 특정 단어가 반복되는지, (특정단어 지정할 경우 가능)
2. 특정 단어 뒤에 나오는 단어가 그 이전 문맥에서 등장하는지, (특정단어 지정할 경... 더 보기
자연어 분석으로 하려고해도, 형태소 정보로 위와 같은 고레벨 정보 추적은 어렵습니다. 로직짜다 세월 갑니다.
제 짧은 식견으로는, 언급하신 건들은 대부분 정규식표현으로 처리 가능할거 같으니 직접 짜보시는게 좋을 것 같네요.
언어는 아무래도 좋을것 같고, 입출력을 웹으로 할건지 파일로 할건지만 결정하셔요.
웹이 텍스트 특성상 (파일 처리 안해도되서) 더 간단할수도 있겠네요.
1. 특정 단어가 반복되는지, (특정단어 지정할 경우 가능)
2. 특정 단어 뒤에 나오는 단어가 그 이전 문맥에서 등장하는지, (특정단어 지정할 경우 가능)
3. 괄호 뒤에 붙은 조사가 적절한지, (가능)
4. 특정 숫자가 특정 영역에서 나타나는지, (의미파악 못했으나 어느정도는 가능할것 같음)
제 짧은 식견으로는, 언급하신 건들은 대부분 정규식표현으로 처리 가능할거 같으니 직접 짜보시는게 좋을 것 같네요.
언어는 아무래도 좋을것 같고, 입출력을 웹으로 할건지 파일로 할건지만 결정하셔요.
웹이 텍스트 특성상 (파일 처리 안해도되서) 더 간단할수도 있겠네요.
1. 특정 단어가 반복되는지, (특정단어 지정할 경우 가능)
2. 특정 단어 뒤에 나오는 단어가 그 이전 문맥에서 등장하는지, (특정단어 지정할 경우 가능)
3. 괄호 뒤에 붙은 조사가 적절한지, (가능)
4. 특정 숫자가 특정 영역에서 나타나는지, (의미파악 못했으나 어느정도는 가능할것 같음)
목록 |
|