트위터 이용자는 월요일에 가장 불행하다?
온라인에서 우리의 활동 이력은 때로는 모여서 집단 지성을 기반으로 하는 핵심 기능으로 사용되기도 하고(구글의 페이지랭크, 이베이의 평판 평가, 아마존의 리뷰와 구매와 관심 유사성을 기반으로 하는 추천 등), 사회 전체의 트렌드나 관심 주제의 변화를 통한 사회 지성의 현재를 알아낼 수 있기도 한다. 때로는 검색어의 변화를 통한 질병의 확산 가능성을 예견하는데 온라인 데이터가 사용될 수 있다는 것을 이미 구글의 ‘독감 트렌드'(Flu Trends, 2008) 분석에서 알 수 있었다.
소셜미디어 상에서 우리가 보이는 행동 데이터의 생성과 변화, 규모와 특정 패턴은 사회를 이루고 있는 사람들의 생각과 행동을 파악하거나 확인함으로써, 국가 정책이나 기업의 전략 수립, 사회를 연구하는 학자들에게 매우 유용하게 활용될 수 있다.
[한상기의 소셜미디어와 사회변화] ⑫ 소셜 데이터의 공공적 가치
지난 칼럼에서 이미 페이스북 데이터를 통해 사람들이 보여주는 사랑의 패턴, 변화, 특성 등에 대한 분석이 가능하다는 것을 소개했다. 많은 학자와 연구 기관들은 소셜미디어 특히 소셜 네트워크에서 활동하는 사람들의 행동과 그들이 올리는 콘텐트를 기반으로 다양한 연구를 진행했다. 이같은 빅데이터 분석을 통해 사회 변화 특히 사람들의 감정이나 집단적 행동을 전체적으로 파악할 수 있다.
소셜 데이터에 숨어있는 새로운 정보 가치를 찾고 분석하는 영역은 ‘소셜 분석’이라는 분야와 ‘빅데이터 분석’ 두 가지가 겹치는 곳이다. 여기에는 통계적 분석, 소셜 네트워크 분석 뿐만 아니라 의견 추출이나 감성 분석을 위한 자연어 처리 등 다양한 데이터 사이언스적인 접근이 필요하다.
초기의 데이터 분석은 주로 트위터나 페이스북의 구조 분석이었다. 수 억 명 또는 수 천 만명의 연결 형태, 평균 친구 수, 임의의 사람들 간의 평균 거리, 연령별/지역별 분포 등이었다. 이는 단순한 구조에 대한 분석이지만 소셜미디어 공간이 어떻게 구성되는 공간인지 그 특징을 알아내는 초기 작업이었다.
이후, 보다 다양한 측면에서 데이터가 보여주는 의미와 특성, 행동의 패턴을 분석해 왔는데, 대표적으로 행복도를 포함한 감정의 표현 분석이 있었다. 이보다 먼저, 사람들이 개인적으로 소셜미디어에서 행복감을 더 느끼는가 또는 외로움을 증폭하는가 하는 주제에 대한 많은 연구가 있었고, 지난 칼럼에서도 소개한 적이 있다 (참고 링크 : ‘소셜 네트워크 안에서 행복하십니까’)
우리는 주말과 연말에 가장 행복하다
소셜미디어 전체 사용자가 보여주는 전반적인 감성의 유형은 어떨까? 버몬트 대학의 피터 닷즈(Peter Dodds)등은 트위터 이용자 6,300만 명의 트윗 45억 8,600만 개 중 460억 7,600만 개의 단어를 추출해서 분석한 결과 전 세계 트위터 사용자는 연말로 갈수록 행복도가 증가하고 새해 초기에는 행복도가 떨어짐을 알았다.[i] 또한 주중을 기준으로 보면 주말에 정점을 찍고 월요일과 화요일에는 바닥을 쳤다.
| 전세계 트위터 사용자의 행복도 변화
코넬 대학의 사회학자들이 사이언스 지에 발표한 연구에서는 2008년 2월부터 2010년 1월까지 84개 국의 240만 트위터 사용자의 트윗을 400개 씩 모아서 분석한 결과, 사람들이 하루에 느끼는 기분의 변화는 나라나 인종과 상관 없이 바이오 리듬과 유사함을 밝혔다.[ii] 즉,밤에는 기분이 좋고 주말 오전도 기분이 좋지만, 출근 전 새벽이나 오후에는 모두 기분이 저조해 지는 것이다.
| 트위터 사용자의 하루 시간 별 감정 변화 [이미지 출처: 뉴욕타임즈]
다시 2013년 5월에 발표한 논문에서 버몬트 대학의 연구자들은 위치 정보가 포함된 천만 개 이상 트윗을 분석해서 미국의 373개 도시 지역 사람들의 행복도를 분석했다.[iii] 결과로 네바다 주와 메인 주가 가장 행복도가 높고, 루이지애나와 미시시피 주의 행복도가 제일 낮은 것으로 나타났다.
| 미국 버몬트 대학의 행복도 분석 연구
훔볼트 대학에서는 15만 개의 위치 정보를 포함한 트윗을 갖고 인종차별, 장애인 비하, 동성애 혐오 등에 대한 분포를 통해 미국 내 대표적 ‘증오 지역’을 찾아낸 적이 있다. 둘을 비교하면 행복도가 높은 곳보다 역시 낮은 곳에서 증오의 표현이 많이 등장함을 알 수 있다.
소셜 데이터를 통해 구글 ‘독감트렌드’처럼 질병의 확산을 파악해보려는 시도도 여러 번 진행되었다. 로체스터 대학의 아담 새들렉은 63만 명 이상의 뉴욕 거주자들의 440만 개의 트윗을 분석해서 누군 가가 아플 수 있다는 것을 8일 전에 90%의 정확도로 예측할 수 있음을 발표했다.
소셜미디어는 정치적인 활동, 참여 촉구를 하는데 매우 중요한 역할을 한다고 알려져 있다. 그러면 정말 사람들이 적극 참여를 하는 것인가?
2010년 미국 의회 선거에서 사람들에게 가서 투표하라는 포스팅이 페이스북 사용자에게 어떤 영향을 미쳤는가 하는 분석이 2012년 9월 ‘네이처’에 실렸다. 6천백만 명에게 전달된 이 메시지를 통해 28만 명이 추가로 투표했다는 결론을 얻었다. 숫자 상으로는 크게 보이지 않지만 접전을 벌이는 지역에서는 몇 만의 숫자는 당락을 결정할 수 있는 큰 의미를 갖는 숫자이며, 이를 통해 소셜 메시지의 영향이 충분히 있음을 알 수 있었다.
지금까지 소개한 연구들처럼 소셜 데이터는 사회 전체의 상황을 보여주는데 좋은 역할을 한다. 이를 기반으로 사람들이 어떻게 행동하는지, 어떤 반응을 보이거나 상호간에 작용을 하는지를 파악할 수 있다는 것은 사회 연구에 매우 큰 변화를 주고 있다.
그러나 여기에서 다시 생각해 봐야 하는 점은 이런 소셜 데이터가 갖는 공공적 가치를 특정 기업이 소유하거나 활용하게만 할 것인가 하는 점이다. 트위터는 많은 데이터를 제공하거나 판매함으로써 이런 연구가 활성화되게 하지만, 페이스북 같은 경우에는 프라이버시 이슈로 외부에서 매우 접근이 어렵다. 국내의 많은 서비스에서 생성되는 데이터 역시 마찬가지이다. 이런 소셜 데이터를 통해서 국가 정책 방향을 수립하거나 공공적 서비스를 구현하는데 사용할 수 있는 방안이 모색이 되어야 할 것이며, 이는 데이터의 공공성이라는 이름에서도 논의할 필요가 있는 부분이다.
뉴스레터 구독하기 | 최신 트렌드를 빠르게 만나보세요!
LiVE LG 뉴스레터 구독하기LiVE LG의 모든 콘텐츠는 자유롭게 이용하실 수 있습니다.
다만 일부 글과 이미지는 저작권과 초상권을 확인하셔야 합니다.운영정책 보기
관련 콘텐츠 리스트
-
-
-
-
슈케어·슈케이스의 화룡점정, 우리가 찍었어요
2023.04.21
인기 콘텐츠 리스트
-
LG전자, 신개념 포터블 스크린 ‘스탠바이미 Go’ 출시
2023.05.31
-
-
김용호의 시선으로 바라본 신비로운 창원과 LG스마트파크
2023.03.30
-