- 다양한 주제에 대해 자유롭게 글을 작성하는 게시판입니다.
Date 16/04/05 02:04:44
Name   April_fool
Subject   100점짜리 단어를 찾아서.

한 십몇년 전부터 인터넷에 떠돌아다니던 글 중에 [100점짜리 인생]이라는 글이 있지요. 진대제 전 정보통신부 장관이 어느 외국인에게 들은 이후로 국내에 퍼졌다는, 태도(Attitude)의 중요성을 강조한 글입니다. 혹시 모르시는 분은 http://todayhumor.com/?bestofbest_223570… 어 이게 아닌가? 아무튼 [100점짜리 단어]라고 검색해 보시면 나옵니다.

하여튼, 이 이야기를 어쩌다가 어제 다시 듣게 되었습니다. 근데 이야기를 듣기 지루했던 저는, 엉뚱한 생각을 하게 되었습니다. 바로 [Attitude] 이외에 저 숫자가 딱 100이 나오는 다른 영어 단어는 얼마나 될까 하는 것이었지요. 그래서, 집에 와서 이걸 알아내기 위한 작업을 시도해 보았습니다.

먼저, 영어 단어의 목록을 알아내어야 했습니다. 인터넷을 뒤진 결과, GCIDE(https://en.wikipedia.org/wiki/GCIDE)라는 무료 영어 사전 파일의 존재를 알아낼 수 있었습니다. 파일을 열어보니, HTML 파일과 유사한 형태의 영어 사전이 알파벳 단위로 끊어져서 정리되어 있더군요. 저는 XML 파싱을 할 줄 모릅니다만, 다행히도 여기서 표제어 부분만 잘라서 추출하는 것은 그다지 어렵지 않았습니다.

work1.py :

#!/usr/bin/python3


import re
import string

a = re.compile("<ent>.*</ent>")

for x in string.ascii_uppercase:
	cide = "CIDE." + x
	with open(cide, mode="r", encoding="latin-1") as f0:
		f1 = f0.readlines()
	for i in f1:
		b = a.findall(i)
		if b != []:
			c = b[0][5:-6]
			print(c.lower())

이렇게 하니까 모두 13만 1555개의 영단어가 추출되었습니다.
그리고 이렇게 해서 만든 영어 단어 파일을 가지고 문제의 계산을 실행하는 코드를 만들어 보았습니다.

work2.py :

#!/usr/bin/python3


import string

with open("wordlist.txt", mode="r") as f0:
	f1 = f0.readlines()

for a in f1:
	a = a[0:-1]
	x = 0
	for b in a:
		if b in string.ascii_letters:
			x = x + (ord(b)-96)
	print(str(a) + "," + str(x))

마지막으로, 이 두 개의 코드를 연달아 실행하는 배치 파일을 작성했습니다.

work.sh :

#!/bin/sh


./work1.py > wordlist.txt
./work2.py > result.csv

그리고 이렇게 해서 나온 결과물인 result.csv를 스프레드시트 프로그램에서 열어, 점수가 딱 100으로 떨어지는 단어들을 필터로 골라 내었습니다. 1346개가 나오던데, 보니까 어째서인지 개중에 중복되는 것이 몇 개씩 눈에 띄어서 확실하지는 않네요.

하여튼, 점수가 100으로 맞아 떨어지는 단어 중에서 몇 가지 눈에 띄는 것을 골라 소개해 봅니다.

  • acknowledge
  • aerometer
  • analysis
  • aneurism
  • annually
  • attitude
  • autoclave
  • automated
  • awfully
  • baby-walker
  • bibliophobia
  • bizantine
  • blissful
  • blue-ribbon
  • botanist
  • boundary
  • boycott
  • browser
  • bubble shell
  • caligraphy
  • cardiograph
  • carpenter
  • chimpanzee
  • clementine
  • clockwise
  • companion
  • comport
  • congress
  • corridor
  • culture
  • deadworks
  • delivery
  • demobilize
  • denominate
  • diamondize
  • digestive
  • discipline
  • disjoint
  • ditroite
  • effectless
  • elsewhere
  • endoplasma
  • excellent
  • eye-catching
  • fatalistic
  • field test
  • fluorine
  • forgiver
  • fountain
  • fresh-cut
  • gray whale
  • hair grass
  • harmonics
  • hemoglobin
  • holograph
  • honeycomb
  • hospital
  • hot-blooded
  • immature
  • imported
  • impotence
  • inexist
  • innovate
  • irritate
  • jurassic
  • king-size
  • liberalism
  • lightning
  • liquid air
  • long-lived
  • lubricant
  • macro lens
  • man-at-arms
  • matchmaking
  • maximize
  • molecular
  • mongolian
  • moralism
  • morphing
  • mummify
  • neoclassic
  • nihilist
  • nonhuman
  • nostalgic
  • off-season
  • one-woman
  • onside kick
  • ornament
  • outlier
  • personal
  • prevent
  • primary
  • printer
  • producer
  • pumpkin
  • pussy
  • quarter
  • repress
  • reprint
  • researcher
  • resolved
  • restore
  • reversal
  • roomful
  • roommate
  • saintlike
  • schoolma'am
  • schoolman
  • scrapbook
  • selective
  • self-defense
  • semaphore
  • session
  • shooter
  • shortcake
  • simulate
  • sleepyhead
  • socialism
  • starfish
  • status
  • stoping
  • stress
  • striker
  • sufficience
  • surcharge
  • surely
  • swimmer
  • syndicate
  • telephone
  • telescope
  • temporal
  • thickening
  • thirty
  • towards
  • troller
  • unavailable
  • unformal
  • unmanlike
  • unmodified
  • unbroken
  • undress
  • vaccinist
  • variety
  • verbalize
  • water gate
  • wednesday
  • whenever
  • whiskey
  • wholesale
  • writing
  • xylose



11
  • 인생은 위스키죠
  • 오오 능력자
  • 프로듀서를 했으면 100점짜리 인생이었던거군요!!


목록
번호 제목 이름 날짜 조회 추천
공지 티타임 게시판 이용 규정 2 Toby 15/06/19 30783 6
14693 스포츠후쿠오카 인근 골프장 리뷰 danielbard 24/05/20 136 3
14692 사회한국언론은 어쩌다 이렇게 망가지게 되었나?(1) 3 + 삼유인생 24/05/20 554 19
14691 게임다크 소울과 마리오를 필두로 한 게임에서 두려움을 다루는 방법 kaestro 24/05/20 221 1
14690 도서/문학제가 드디어 에어북을 출간했습니다. 11 카르스 24/05/19 607 29
14689 게임[LOL] 5월 19일 일요일 오늘의 일정 2 발그레 아이네꼬 24/05/18 104 0
14688 게임게임은 어떻게 두려움을 통해 유저를 영웅으로 만드는가 4 + kaestro 24/05/18 413 3
14687 스포츠[MLB] 이정후 어깨 수술로 시즌 아웃 1 김치찌개 24/05/18 231 0
14686 음악[팝송] 시아 새 앨범 "Reasonable Woman" 김치찌개 24/05/18 92 0
14685 게임[LOL] 5월 18일 토요일 오늘의 일정 3 발그레 아이네꼬 24/05/17 150 0
14684 게임[LOL] 5월 17일 금요일 오늘의 일정 4 발그레 아이네꼬 24/05/16 198 0
14683 일상/생각작고 소중한 28회의 클릭 2 kaestro 24/05/16 357 3
14682 게임[LOL] 5월 16일 목요일 오늘의 일정 발그레 아이네꼬 24/05/15 160 0
14681 일상/생각비어있는 공백기가 아니라 충만한 탐색기(1) 4 kaestro 24/05/15 528 2
14680 IT/컴퓨터Life hack : 내가 사용하는 도구들 2 Jargon 24/05/14 625 4
14679 게임[LOL] 5월 15일 수요일 오늘의 일정 발그레 아이네꼬 24/05/14 194 0
14678 오프모임(동대문구) 같이 종종 공부할 분 22 골든햄스 24/05/14 725 4
14677 오프모임하다하다 이제는 점심식사 벙 올립니다.(술 x) 19 비오는압구정 24/05/14 565 7
14676 IT/컴퓨터BING AI 에서 노래도 만들어주네요.. 3 soulless 24/05/14 238 0
14675 게임[LOL] 5월 14일 화요일 오늘의 일정 1 발그레 아이네꼬 24/05/13 156 0
14674 일상/생각삽자루를 추모하며 3 danielbard 24/05/13 595 25
14673 과학/기술처음으로 가르친 수업, 강의 끝나는 김에 적어보는 배운 점 11 Velma Kelly 24/05/13 716 5
14672 일상/생각인체공학을 염두에 둔 내 pc용 책상 세팅(2) 2 kaestro 24/05/12 373 0
14671 일상/생각요즘에는 은근 아껴쓰는거 같네요. 14 아름다울 24/05/12 1066 0
14670 IT/컴퓨터인체공학을 염두에 둔 내 pc용 책상 세팅(1) 23 kaestro 24/05/12 543 2
목록

+ : 최근 2시간내에 달린 댓글
+ : 최근 4시간내에 달린 댓글

댓글