책머리에
제1부 총론
제1장 신문 빅데이터와 연구 방법
제2장 빅데이터 시대의 디지털 인문학
제3장 ‘물결21’ 코퍼스공개 웹 자원 및 활용 도구
제2부 키워드
제4장 ??동아일보?? 키워드를 통해 본 분단체제 정체성과 이념 갈등
제5장 국내 4대 일간지 신문의 키워드에서 나타난 ‘스마트’의 트렌드
-2000년대 이후의 기사를 중심으로
제6장 여가餘暇와 그 관련어 분석을 통한 한국 여가문화의 변화
제3부 공기어共起語
제7장 공기어로 살펴본 신문별 유사도 비교 연구
-??조선일보??, ??동아일보??, ??중앙일보??, ??한겨레신문??을 중심으로
제8장 ‘대선’관련어의 추이 분석과 전망-16∼18대 대선을 대상으로
제9장 신문 빅데이터 기반의 단어 사용과 트렌드 분석
-신문의 명사 빈도 사용 패턴을 중심으로
제4부 네트워크
제10장 공기어 네트워크의 변화 양상-‘가족’과 ‘친구’를 중심으로
제11장 공기어 네트워크와 사회 계층에 대한 관심의 트렌드
제12장 형용사 유의어의 공기어 네트워크와 활용-‘안타깝다’류의 형용사를 중심으로
5억 9천만 어절의 신문 데이터에서 찾은 한 글자
신문에선 연일 인문학과 디지털의 융합을 이야기한다. 이러한 관심에 따라 관련 논의도 폭증하고 있다. 그런데 과연 구체적인 사례나 성과를 보인 경우가 얼마나 될까. 지난 14년 치(2000~2013년의 일간지(조선일보, 동아일보, 중앙일보, 한겨레신문, 창간 순 신문기사를 가지고 구축한 빅데이터는 우리에게 인문학과 디지털 융합에 대한 하나의 방향을 보여준다.
매일 스마트폰으로 수많은 신문이 쏟아진다. 우리는 신문을 읽으며 최신의 정보를 접하고 있다. 그런데 생각해 보자. 이 ‘말’이 주는 정보가 어제와 같은 정보일까. 아니, 작년이나 10년 전에는 또 어떨까. 고려대학교 민족문화연구원 디지털인문학센터는 5억 9천만 어절의 신문 데이터를 가지고 다양한 연구를 진행해 왔다.
인문학이 읽어낼 시대의 창
??키워드, 공기어, 네트워크??는 세계 각국의 디지털 인문학 연구 동향에서부터 신문 데이터의 구축과 연구 방법론, 그리고 각 개별 사례를 망라한 책이다. 고려대학교 민족문화연구원 디지털인문학센터는 신문 빅데이터, ‘물결 21’ 코퍼스를 구축한 뒤 일반인에게 공개하고 있는데, 이 책에서는 ‘물결 21’ 코퍼스의 소개를 겸하고 있다. 보다 많은 사람들이 늘어나는 디지털 인문학 수요와 관심을 갖기 바라는 마음에서다.
저자들은 국어학 뿐만 아니라, 코퍼스언어학, 자연어 처리와 전산학, 사회학, 북한학, 문헌정보학, 역사학 등 다양한 전공으로 구성되어 있다. 하나의 도구를 가지고 다양한 분야에 접목함으로써 신문 빅데이터가 보여주는 통계적 결과들을 통해, 우리 사회의 면면들을 유의미하고 폭넓게 바라보고 있다.
‘스마트’하게 ‘사회’의 흐름을 살피다
이 책은 총 3부로 이루어져 있다. 1부는 총론으로 디지털 인문학에 대한 전반적인 경향과 방법을 논의한다. 신문 빅데이터의