- 다양한 주제에 대해 자유롭게 글을 작성하는 게시판입니다.
Date 16/04/05 02:04:44
Name   April_fool
Subject   100점짜리 단어를 찾아서.

한 십몇년 전부터 인터넷에 떠돌아다니던 글 중에 [100점짜리 인생]이라는 글이 있지요. 진대제 전 정보통신부 장관이 어느 외국인에게 들은 이후로 국내에 퍼졌다는, 태도(Attitude)의 중요성을 강조한 글입니다. 혹시 모르시는 분은 http://todayhumor.com/?bestofbest_223570… 어 이게 아닌가? 아무튼 [100점짜리 단어]라고 검색해 보시면 나옵니다.

하여튼, 이 이야기를 어쩌다가 어제 다시 듣게 되었습니다. 근데 이야기를 듣기 지루했던 저는, 엉뚱한 생각을 하게 되었습니다. 바로 [Attitude] 이외에 저 숫자가 딱 100이 나오는 다른 영어 단어는 얼마나 될까 하는 것이었지요. 그래서, 집에 와서 이걸 알아내기 위한 작업을 시도해 보았습니다.

먼저, 영어 단어의 목록을 알아내어야 했습니다. 인터넷을 뒤진 결과, GCIDE(https://en.wikipedia.org/wiki/GCIDE)라는 무료 영어 사전 파일의 존재를 알아낼 수 있었습니다. 파일을 열어보니, HTML 파일과 유사한 형태의 영어 사전이 알파벳 단위로 끊어져서 정리되어 있더군요. 저는 XML 파싱을 할 줄 모릅니다만, 다행히도 여기서 표제어 부분만 잘라서 추출하는 것은 그다지 어렵지 않았습니다.

work1.py :

#!/usr/bin/python3


import re
import string

a = re.compile("<ent>.*</ent>")

for x in string.ascii_uppercase:
	cide = "CIDE." + x
	with open(cide, mode="r", encoding="latin-1") as f0:
		f1 = f0.readlines()
	for i in f1:
		b = a.findall(i)
		if b != []:
			c = b[0][5:-6]
			print(c.lower())

이렇게 하니까 모두 13만 1555개의 영단어가 추출되었습니다.
그리고 이렇게 해서 만든 영어 단어 파일을 가지고 문제의 계산을 실행하는 코드를 만들어 보았습니다.

work2.py :

#!/usr/bin/python3


import string

with open("wordlist.txt", mode="r") as f0:
	f1 = f0.readlines()

for a in f1:
	a = a[0:-1]
	x = 0
	for b in a:
		if b in string.ascii_letters:
			x = x + (ord(b)-96)
	print(str(a) + "," + str(x))

마지막으로, 이 두 개의 코드를 연달아 실행하는 배치 파일을 작성했습니다.

work.sh :

#!/bin/sh


./work1.py > wordlist.txt
./work2.py > result.csv

그리고 이렇게 해서 나온 결과물인 result.csv를 스프레드시트 프로그램에서 열어, 점수가 딱 100으로 떨어지는 단어들을 필터로 골라 내었습니다. 1346개가 나오던데, 보니까 어째서인지 개중에 중복되는 것이 몇 개씩 눈에 띄어서 확실하지는 않네요.

하여튼, 점수가 100으로 맞아 떨어지는 단어 중에서 몇 가지 눈에 띄는 것을 골라 소개해 봅니다.

  • acknowledge
  • aerometer
  • analysis
  • aneurism
  • annually
  • attitude
  • autoclave
  • automated
  • awfully
  • baby-walker
  • bibliophobia
  • bizantine
  • blissful
  • blue-ribbon
  • botanist
  • boundary
  • boycott
  • browser
  • bubble shell
  • caligraphy
  • cardiograph
  • carpenter
  • chimpanzee
  • clementine
  • clockwise
  • companion
  • comport
  • congress
  • corridor
  • culture
  • deadworks
  • delivery
  • demobilize
  • denominate
  • diamondize
  • digestive
  • discipline
  • disjoint
  • ditroite
  • effectless
  • elsewhere
  • endoplasma
  • excellent
  • eye-catching
  • fatalistic
  • field test
  • fluorine
  • forgiver
  • fountain
  • fresh-cut
  • gray whale
  • hair grass
  • harmonics
  • hemoglobin
  • holograph
  • honeycomb
  • hospital
  • hot-blooded
  • immature
  • imported
  • impotence
  • inexist
  • innovate
  • irritate
  • jurassic
  • king-size
  • liberalism
  • lightning
  • liquid air
  • long-lived
  • lubricant
  • macro lens
  • man-at-arms
  • matchmaking
  • maximize
  • molecular
  • mongolian
  • moralism
  • morphing
  • mummify
  • neoclassic
  • nihilist
  • nonhuman
  • nostalgic
  • off-season
  • one-woman
  • onside kick
  • ornament
  • outlier
  • personal
  • prevent
  • primary
  • printer
  • producer
  • pumpkin
  • pussy
  • quarter
  • repress
  • reprint
  • researcher
  • resolved
  • restore
  • reversal
  • roomful
  • roommate
  • saintlike
  • schoolma'am
  • schoolman
  • scrapbook
  • selective
  • self-defense
  • semaphore
  • session
  • shooter
  • shortcake
  • simulate
  • sleepyhead
  • socialism
  • starfish
  • status
  • stoping
  • stress
  • striker
  • sufficience
  • surcharge
  • surely
  • swimmer
  • syndicate
  • telephone
  • telescope
  • temporal
  • thickening
  • thirty
  • towards
  • troller
  • unavailable
  • unformal
  • unmanlike
  • unmodified
  • unbroken
  • undress
  • vaccinist
  • variety
  • verbalize
  • water gate
  • wednesday
  • whenever
  • whiskey
  • wholesale
  • writing
  • xylose



11
  • 인생은 위스키죠
  • 오오 능력자
  • 프로듀서를 했으면 100점짜리 인생이었던거군요!!


목록
번호 제목 이름 날짜 조회 추천
2387 의료/건강멘탈이 튼튼해야 오십견을 이겨낼 수 있다네요. 25 April_fool 16/03/11 4709 0
2451 IT/컴퓨터데스크톱에서 여자친구 사진을 개선하는 신경망 5 April_fool 16/03/22 6678 1
2470 IT/컴퓨터인공지능 테이가 하루만에 오프라인이 된 사연 12 April_fool 16/03/25 6033 2
2999 음악쇼스타코비치 교향곡 제7번 “레닌그라드” 제1악장 3 April_fool 16/06/11 3812 0
2536 정치이번 선거 공보물에 대한 인상 한줄평 10 April_fool 16/04/04 4233 0
2543 IT/컴퓨터100점짜리 단어를 찾아서. 29 April_fool 16/04/05 13872 11
2550 IT/컴퓨터100점 이상의 단어를 찾아서. 8 April_fool 16/04/05 7230 4
3455 과학/기술인공지능 왓슨의 의학적 진단 보조 사례 33 April_fool 16/08/05 5484 1
2929 과학/기술what3words - 전세계 공통 주소체계 19 April_fool 16/06/01 6277 1
2709 IT/컴퓨터요즘 게임에서 어뷰저를 걸러내는 방법 4 April_fool 16/04/28 5042 1
2732 일상/생각오늘의 일기 6 April_fool 16/05/02 3570 0
2829 정치[불판] 국방부 曰 "공중보건의도 없애겠다" 57 April_fool 16/05/17 6153 0
3062 음악히라노 아야 - God knows 7 April_fool 16/06/18 6246 1
3337 정치[펌글] 정의당이 메갈을 지지한 진짜 이유? 8 April_fool 16/07/24 6350 0
3396 과학/기술창백한 푸른 점 6 April_fool 16/07/29 6844 3
3438 과학/기술여성의 오르가즘은 왜 생겼나? 46 April_fool 16/08/03 7694 0
3533 철학/종교분할뇌 문제와 테세우스의 배 패러독스 35 April_fool 16/08/18 6069 0
3602 일상/생각[근황] 나는 경기도 안양의… 핫 내가 무슨 소리를?! 38 April_fool 16/08/29 4410 5
3820 IT/컴퓨터컴퓨터는 어떻게 빠르게 검색을 할까 - 보이어-무어-호스풀 알고리즘 18 April_fool 16/10/04 5973 7
3856 의료/건강시력의 정의(definition) 9 April_fool 16/10/09 12543 3
3931 기타[토막상식] 공칭치수(Nominal dimension)에 대하여 11 April_fool 16/10/16 21793 4
3994 과학/기술[토막상식] 정확도(accuracy)와 정밀도(precision)에 대하여 19 April_fool 16/10/24 19227 1
4497 일상/생각잡담 몇 가지. 10 April_fool 16/12/31 3901 0
4572 IT/컴퓨터[소개] Swift Calcs - 최고의 온라인 계산기 8 April_fool 17/01/08 8554 10
4600 기타[퀴즈] O링의 크기를 알아맞히는 법 42 April_fool 17/01/11 11222 0
목록

+ : 최근 2시간내에 달린 댓글
+ : 최근 4시간내에 달린 댓글

댓글