논문 동영상


우리는 오래전에 이미 수많은 개발 언어를 기반으로 원하는 환경에 적합한 개발했던 경험이 있었다.

Assemble, C, Basic, C++, Java, Pascal, Cobol, C#, Delphi 등.. 본인도 오래전에 여기에 있는 모든 언어들을 기반으로 대학에서 수업도 받았고 숙제도 했었다. 


그 당시에는 이 정도의 언어면 충분하다고 생각했었다. 그리고 웹 관련 개발 언어(JavaScript, PHP, ASP, JSP 등)에 대한 관심은 많지 않았고, 특히 JavaScript에 대한 천시하는 분위기까지 있었다. 


그런데 IT 환경 변화는 분명히 있었고, 기술 개발도 매우 빠르게 변해가는 모습이었다. 


분명한 것은 환경은 변화하고 있다는 것이다. 

따라서, 오래전 구식화된 모습의 개발 언어로 변화하는 기술에 대응하는 것에는 무리가 따르기 마련이다. 

그렇다면 환경에 적합한 개발 언어 및 프래임워크의 필요성은 두말할 나위가 없다.


새로운 언어를 개발하는 건 쉽지 않은 일이다. 

개발자들에게 사랑받는 언어가 되기까지는 오랜 시간이 필요하다. 

많은 수고가 필요함에도 주요 업체(Apple, MS, Google 등)은 왜 직접 프로그래밍 언어를 개발했을까? 


일단 개발 생태계를 확보하는 전략으로 풀이할 수 있다. 

수없이 개발되고 있는 하드웨어에 적합한 형태의 앱 개발이 이루어져야 한다. 즉, 해당 하드웨어로 표현하고자 정보를 구현하기 위해서는 수많은 개발자와 함께 앱 개발 생태계를 만들고, 그로 인한 부가가치를 창출해야 한다. 


이러한 생태계를 보다 적극적으로 지원하기 위해 애플 및 많은 업체들은 좋은 프로그래밍 언어와 프레임워크를 기업 차원에서 직접 지원할 수 밖에 없는 구조가 되었다. 


애플은 최근 스위프트를 iOS와 OS X 뿐만 아니라 애플와치 운영체제인 ‘와치OS(watchOS)’, 그리고 애플TV를 위한 운영체제 ‘TVOS’에 가장 적합한 언어를 선보이고 있다. Google은 Android 및 JavaScript를 기반으로 하드웨어에서 사용할 수 있는 양질의 콘텐츠를 앱 생태계에서 끌어올려는 것으로 보인다.


새로운 시대에 필요한 기능을 예전 언어로 구현하기 힘들기 때문이다. C, 자바, 오브젝티브 C등 기존에 많이 사용된 언어들은 10~30년 전에 개발된 언어들이다. 과거에는 모바일 기기도 없었고, 수많은 사용자들이 스마트 기기와 웹사이트에 몰리지도 않았다. 이미지, 동영상 등 사용자가 소비하는 콘텐츠도 과거와 많이 달라지고 있다. 

최근엔 새로운 기능과 현대 시대에 맞는 프로그래밍 방식을 언어 차원에서는 지원하는 경우가 늘고 있다. 

즉, 애플의 스위프트를 비롯해 구글이 만든 ‘고(Go)’, 모질라재단이 만든 ‘러스트(Rust)’, 젯브레인이 만든 ‘코틀린(Kotlin)’ 등이 대표적이다. 

우리가 매일 접속하는 웹사이트는 크게 3가지 요소로 구성된다. 

‘HTML(Hyper Text Markup Language)’, ‘CSS(Cascading Style Sheets)’, ‘자바스크립트(Javascript)’다. 

- HTML은 웹페이지의 큰 뼈대를 제공하고, 

- CSS는 색깔이나 글씨체와 같은 디자인 요소를 관리한다. 

- 자바스크립트는 크로스 플랫폼(crossplatform)6, 객체지향 스크립트 언어로 웹페이지의 동작을 담당한다. 

예를 들어 자바스크립트를 이용하면 ‘버튼을 클릭하면 밑에 날짜를 보여줘’라는 식의 명령을 내릴 수 있다.

자바스크립트를 이용하면 웹에 풍부한 효과를 넣을 수 있지만, 2000년대 초반만 해도 자바스크립트는 개발자들에게 무시당하는 언어였다. 별다른 기능도 없고, 성능도 별로 좋지 않았기 때문이다. 하지만 최근 몇 년 사이에 다양한 자바스크립트 프레임워크와 라이브러리가 생기면서 자바스크립트 생태계는 크게 확장되고 있으며, 그 위상도 점점 높아지고 있다.

프로그래밍 입문자들은 자바스크립트와 자바(Java)가 서로 비슷한 기술이라고 생각하곤 한다. 두 언어 모두 자바라는 단어를 사용하기 때문이다. 하지만 자바스크립트는 자바와는 전혀 관계가 없다. 언어를 만든 사람부터 기능과 사용법까지 완전히 다르다.

자바스크립트는 브랜든 아이크(Brendan Eich)가 개발했다. 브랜든 아이크는 1995년 넷스케이프에 근무하면서 자바스크립트 개념을 만들었다. 그는 처음에는 자바스크립트가 아닌 ‘모카(Mocha)’라는 이름을 붙였다. 모카는 1995년 12월 ‘라이브 스크립트(LiveScript)’라는 이름으로 바뀌었는데, 당시 자바가 큰 인기를 끌자 마케팅 효과를 노려 이름을 자바스크립트로 변경했다. 이후 자바스크립트 기술이 다양하게 발전했고, 이에 대한 표준과 명세를 ECMA 인터내셔널에서 관리하고 있다.


Java와 비교한 JavaScript

자바스크립트와 자바 비교 <출처: (CC-BY-SA) MDN(Mozilla Developer Network)




배우기 쉽고 확장성 높지만, 보안엔 취약해

자바스크립트는 다양한 장점과 단점을 가진다. 


먼저 장점부터 살펴보자. 

자바스크립트는 컴파일 과정이 없기 때문에 다른 언어와 비교했을 때 빠른 시간 안에 스크립트 코드를 작성할 수 있게 도와준다. 기존 C나 자바 언어와 달리 굉장히 단순한 구조와 원칙을 가지고 있기 때문에 초보 개발자들이 쉽게 배우고 이해할 수 있다.


예를 들어 자바스크립트 코드 안에서는 변수, 클래스 및 메소드를 선언하지 않아도 되고, 메소드가 ‘public’, ‘private’ 또는 ‘protected’인지 구분하지 않아도 된다. 이러한 특징은 개발자마다 서로 다른 방식으로 코드를 짜는 부작용도 있다. 그래서 구글이나 에어비앤비 같은 기업들은 ‘자바스크립트 스타일 가이드’라는 문서를 따로 만들어 읽기 쉽고 실수를 피할 수 있는 자바스크립트 작성법을 공개하기도 했다. 자바스크립트는 웹에 특화된 기술이기 때문에 운영체제나 플랫폼에 상관없이 잘 작동되고 확장성도 높다. 


단점은 성능이나 보안 측면이다. 

일단 내부에서 제공되는 기능이 제한적이고, 관련된 개발도구도 적은 편이다. 또한 자바스크립트는 HTML 소스코드에 함께 작성되면서 소스코드가 외부로 공개되는데, 이 과정에서 보안 취약점이 발생할 수 있다.


‘개발자가 가장 관심 많이 갖는 언어’로 꼽혀

깃허브에 작성된 소스코드 언어 종류. 2013년 이후 자바스크립트가 가장 많이 활용되고 있다. <출처: 깃허브 블로그>

개발자들의 대표 커뮤니티인 스택오버플로우는 2015년 157개국에 있는 사용자 2만6천여명에게 다양한 기술 관련 설문조사를 실시했다. 그 결과 자바스크립트는 ‘스위프트’와 함께 개발자들이 가장 많이 관심을 가지는 언어로 뽑혔다. 스택오버플로우는 설문조사 결과를 발표하면서 “자바스크립트는 가장 많이 사용하고 있는 프로그래밍 언어이며, 노드JS와 앵귤라JS가 눈에 띄게 성장하고 있다”라고 밝혔다. 오픈소스 개발자들이 많이 모이는 깃허브에서도 “자바스크립트가 소스코드 저장소에서 가장 많이 활용되고 있다”라는 통계를 공개했다. 그만큼 자바스크립트가 눈에 띄게 성장하고 있다는 뜻이다. 오픈소스 커뮤니티처럼 개인 개발자가 만든 기술도 많지만, 기업이 직접 자바스크립트 기술을 배포해 사용자를 모으는 경우도 적잖다.

특히 최근에는 자바스크립트 관련 라이브러리나 프레임워크가 개발자들 사이에서 큰 화제다. 위키피디아에 올라온 ‘자바스크립트 라이브러리 목록’을 보면 관련된 기술이 90여개인데다 데이터과학, 이용자조작화면(UI), 서버 등 활용 분야도 다양하다. 다음은 최근 큰 인기를 끄는 자바스크립트 기술들이다.

자바스크립트 관련 기술들 로고 <출처: 각 홈페이지>



자바 스크립트 세계가 빠르게 움직이기 때문에 JavaScript 관련된 프레임워크를 이해할 필요가 있다.


React.JS

React에서는 모든 것이 JavaScript만으로 매우 심플하고 우아한 느낌을 준다. 


React.js는 사용자 인터페이스를 만들기 위한 자바스크립트 라이브러리다. 

페이스북이 만든 기술로, 2013년에 공개됐다. 

커스텀 태그, 가상 DOM, 단방향 데이터 바인딩 기능을 제공해 주목을 받고 있다. 

워드프레스, 넷플릭스가 리액트JS를 사용하고 있다.

리액트JS 기술의 강점은 모바일 쪽에서 활용되고 있다는 것이다..


React에서 모든 컴포넌트는 JavaScript에서 작동하는 선언적 XML 유사 구문인 JSX를 사용해 렌더링 함수 안에서 UI를 표현하는 형식을 취한다. 



AngularJS (Angular 1)

앵귤라JS(Angular.js)는 웹 애플리케이션 프레임워크로, 개발과 테스트 환경을 단순화시킨 기술이다. 

구글이 직접 만들었으며, 현재 버전은 2.0까지 나왔다. 

해외에는 ‘앵귤라JS잡닷컴’이라는 구직 웹사이트가 있을 정도로 앵귤라JS의 인기는 높다. 

앵귤라JS는 JQuery 및 JavaScript UI 컴포넌트를 쉽게 재사용할 수 있다. 

양방향 데이터 바인딩을 통해 불필요한 코드를 제거해 향후 유지보수를 쉽게 할 수 있는 장점도 지녔다.

Angular는 TypeScript가 필수적인데, TypeScript를 사용하면 Java와 C#을 다루던 사용자에게 생산성을 올려주고 정적 타입 체크 등의 많은 이익이 있다. 


소규모 사례에서 TypeScript를 사용하면 생산성 향상보다 많은 오버헤드가 발생할 수 있기 때문에 

대규모 프로젝트에 적합할 수 있다고 한다. 


VUE.JS

Vue.js는 웹 개발을 단순화하고 정리하기 위해 개발된 대중적인 자바스크립트 프론트엔드 프레임워크이다.

웹 UI 개발(컴포넌트, 선언형 UI, 핫 리로딩, 타임 트래블 디버깅 등)에 접근의 용이성이 뛰어나며, 개발자들이 익히기에 쉽다.


Vue는 Evan You에 의해 개발되었는데, Angular 장점만을 가지고 만들어진 것이므로 대중적 성격의 인기를 끌고 있다. 리액트에 이어 2번째로 대중적인 자바스크립트 프레임워크/라이브러리로 인정받고 있다. 



D3.JS
D3는 ‘Data Drivened Document’(데이터 기반 문서)의 약자로, 자바스크립트 라이브러리다. 데이터와 이미지를 함께 묶어 표현해줘 데이터 시각화를 웹페이지에서 표현할 때 많이 사용된다.



Ember

Ember는 완전한 기능의 프레임워크로 평가받고 있다. 

익숙해지기까지는 오랜 시간이 소요되지만, 일단 익숙해지면 생산성을 높일 수 있다는 장점을 가진다. 


Knockout



Polymer

Polymer는 Google이 후원하는 또 다른 프로젝트이며 실제로 Vue의 영감의 원천이었다. 

Vue의 컴포넌트는 Polymer의 사용자 지정 엘리먼트 등 매우 유사한 개발 스타일을 제공한다. 

Polymer는 최신 웹 컴포넌트 기능을 기반으로 한다. 



Riot

Riot 3.0은 작고 아름답게 디자인 된 API를 사용하여 유사한 컴포넌트 기반 개발 모델 (Riot에서 “태그”라고 함)을 제공한다. 



Node.JS

노드JS(Node.js)는 자바스크립트 엔진 ‘V8’ 위에서 동작하는 이벤트 처리 I/O 프레임워크다. 

서버 환경에서 자바스크립트로 애플리케이션을 작성할 수 있게 돕는다. 

노드JS의 장점은 비동기 프로그래밍이다. 

비동기는 이벤트를 요청하고 바로 결과를 받지 않아도 된다. 

따라서 결과값을 기다리지 않고 보다 다양한 요청을 처리할 수 있다. 

웹 분야에서는 비동기 프로그래밍을 쓰는 경우가 드물었는데, 노드JS로 비동기 프로그래밍을 비교적 쉽게 할 수 있게 됐다.







IT 개발 관련해서는 여러 웹 개발 언어가 있다. 

언어별로 각자의 장단점이 있기 때문에, 여러가지 기술을 각자 배운 개발자들이 - 

특히, JavaScript와 관계된 언어(React JS, VUE JS, Angular JS) 그리고 JAVA와 C#과의 연계 등

각자의 언어로 모든 서비스를 단일하게 통일시켜 만드는 것이 기존의 패러다임이었다. 


그러나 최근 들어서는 각각의 기능을 개발하기에 효율적이라 여겨지는 언어들로 개별 내용들을 개발하고. 그 모듈들을 계층화하여 연결하는 형태의 웹 개발이 늘어나고있다. 


기존의 상황이 한가지 언어를 선택하면 - 그 언어로 개발된 다른 기능들을 만들기 위해 - 해당 개발자들과만 협업해야하는 상황이었는데. 이제는 굳이 한가지 언어만을 고집할 필요가 없어진 것이다. 

실제로 모듈러 형식의 웹개발에서는 다양한 언어를 기반으로 만들어진 모듈들이 연결되어있다. 

당연히 서로 말이 통해야하므로, 모듈간 통신이 중요해진다. 

여기에 쓰이는 것이 바로 Json이다. 


Json기반으로 각각의 모듈이 보내는 통신 규격을 변환해서 - 각각의 모듈이 일관적인 정보를 받아볼 수 있도록 만드는게 모듈러 형태 개발의 핵심이다. 



Java Script 기반 프레임워크 - 리액트, 뷰, 앵글러

자바스크립트라는 언어는 웹 상에서 HTML을 다루고, 내용을 변경할 수 있는 편리한 언어다. 

그러나 기본적으로 모든 언어는 그 자체만으로 완벽할 수는 없다.

그러한 이유로 규격화하고, 단순하게 사용할 수 있는 프레임워크가 만들어졌다. 


현재 전 세계에서 세가지 프레임 워크가 서로 경쟁을 벌이고있는데, 그중에 가장 유명한 것 세가지가 리액트 (React JS), 뷰 (Vue JS). 앵글러 (Angular JS)다. 



빅 데이터가 빅 이슈다. 

스마트폰과 소셜 미디어에 이어 빅 데이터 열풍이다. 

하루가 멀다 하고 빅 데이터 관련 포럼이 열리고 매일 빅 데이터를 분석한 내용이 기사화된다. 

-서울시는 KT의 심야 통화 기록을 활용해 심야버스 노선을 확정했다. 

-현대카드는 커피전문점 결제 내용을 분석해 커피전문점이 서울에서는 포화 상태지만 지방에서는 확장 단계라는 결론을 이끌어냈다. 

-서울 강북삼성병원은 다음소프트와 함께 자살 예보 시스템을 구축했다. 

-서울대는 각 분야 교수들이 연합해 빅 데이터 센터를 만들었고, 

-국민대는 경영전문대학원(MBA)에 빅 데이터 경영 과정을 신설했다. 


빅 데이터의 시대

그렇다면 ‘빅 데이터(Big Data)란’ 무엇인가. 

- 인터넷 쇼핑몰에서 물건을 사고, 

- 선생님이 아니라 포털에서 궁금증을 해결하며,

- 자신의 의견 및 관심사도 친구보다 트위터나 유튜브로 발신하는 시대

=> 시민들의 생활 하나하나가 ‘디지털 흔적(자료)’으로 남고, 그 양과 종류가 폭증하는 것


- 세계적 인터넷 포털 사이트인 구글이 하루에 처리하는 데이터 양이 24페타바이트(약 2400만 기가바이트)쯤(2013년 통계) : 미국 의회도서관에 있는 전체 인쇄물의 수천 배에 달한다.

- ‘디지털 데이터’의 폭증과 더불어 최근에는 이에 대한 분석기법까지 비약적으로 발전하면서 사회의 움직임을 더욱 정확하게 분석하고 예측할 수 있게 되었다. 



상관성 중시


빅 데이터 연구자들은 두 데이터 사이의 인과성보다는 상관성을 중시한다. 

- 상관성은 두 데이터 값 사이의 통계적 관련성을 수량화한 것이다. 

상관성이 강하다는 것은 하나의 데이터 값이 변화할 때 다른 하나도 변할 가능성이 높다는 뜻이다.

대표 사례가 월마트에서 기저귀 매출과 맥주 매출이 비슷한 궤적을 그리는 현상이다. 

- 남편들이 기저귀 심부름을 왔다가 맥주도 사간 것으로 추측할 수 있는데, 

이런 ‘인과관계’가 맞는지보다 기저귀 매출이 오르면 맥주 매출도 오르는 상관관계에 주목한다. 

빅 데이터 분석의 특징을 한마디로 말하면 ‘왜 그러는지는 잘 모르겠지만 앞으로 어떻게 될지 예측할 수 있다’는 것이다.

대선 한 달 전 빅 데이터 분석 전문기업 다음소프트의 송길영 부사장은 ‘기분이 나쁘면 경기도 나쁘다’는 ‘공포지수’가 주가 예측에 유용하다며, 자신의 책에 다음과 같이 예언했다. “대통령 선거 결과를 알고 싶다면 선거 1~2주 전에 코스피 지수를 보면 된다. 코스피 지수가 올라가면 여당이 이기고, 떨어지면 야당이 승리할 가능성이 높다.” 실제 결과는 어땠을까? 11월19일에서 12월18일까지 코스피 지수는 1878.10에서 1993.09로 가파르게 상승했다. 그리고 여당 후보인 박근혜 대통령이 당선되었다. 주가지수와 박근혜 대통령 당선 사이에 인과관계가 있다고 확실히 말할 수는 없다. 하지만 미국 대선에서 계속 증명되어온 주가 그래프와 대선 결과의 상관성이 우리나라 선거에서도 어느 정도 드러난 셈이다.

빅 데이터와 관련해서 가장 각광받는 분야는 트위터·페이스북 같은 SNS에 사람들이 쏟아낸 말을 통해 사회적 분위기를 파악하는 ‘정서 분석(Sentiment Analysis)’이다. 일각에서는 SNS의 정서를 분석해 주가를 예측할 수 있다고 주장한다. 미국의 ‘텍스트 마이닝(대량의 정보에서 목적에 부합하는 의미 정보를 추출하는 방법)’ 전문가들은 트위터에 표현된 정서를 계량화한 수치가 다우존스 지수를 87.6%의 정확도로 맞힌다는 것을 발견했다. 이를 바탕으로 자동 주식거래 시스템인 ‘더웬트 앱솔루트 리턴 펀드(Derwent Absolute Return Fund)’를 만들었다. 


SNS 감성을 기반으로 주식 투자도

국내에서도 비슷한 시도가 있었다. 다음소프트의 ‘감성 기반 트레이딩 펀드’가 바로 그것이다. 지난해 다음소프트는 ‘최근 100일’ 동안의 감성 데이터와 주식 데이터의 관계 분석을 기반으로 ‘주식 자동거래 프로그램’을 만들었다. 감성 데이터에서 주가가 오를 것으로 예상되면 자동으로 주식을 사고, 떨어질 것으로 보이면 주식을 파는 프로그램이다. 자본금 3000만원으로 시작한 이 펀드는 코스피 200 종목과 코스닥 10 종목 중 시민들의 감성에 영향을 받기 쉬운 것으로 추정되는 주식들을 거래 대상으로 삼았다. 이처럼 명확한 논리적 인과관계를 입증할 수는 없지만, 시차를 두고 나타나는 통계적 관련성을 찾는 것을 학계에서는 ‘그랜저 인과관계 분석’이라고 한다.

이 프로그램은 제법 성공적이었다. 2012년 8월6일부터 2012년 12월28일까지 약 150일 동안 거래했는데 코스피 지수가 6.1% 오르는 동안 다음소프트의 펀드는 9.7%의 수익률을 올렸다. 이 펀드의 수익률은 대통령 선거일인 12월18일까지는 13.1%였는데, 이후 10일 동안 크게 떨어져 9.7%로 마감되었다. 이는 감성 기반 프로그램이 대선 결과에 따른 대중의 급격한 심리변화를 제대로 반영하지 못했기 때문으로 보인다. 미국의 경우, 보통 현직 대통령이 재임에 성공한 경우 주식시장은 상승세를 보이고, 현직 대통령이 패하면 하락세를 보인다. 한국 주식시장 역시 대선 이후 1주일 정도 조정장을 거쳤는데, 일종의 ‘대선 멘붕(멘탈 붕괴)’ 현상이 나타났음을 확인할 수 있다.

빅 데이터는 공공 영역에서 더욱 빛을 발한다. 일단 데이터가 많고 상업적 활용보다 데이터 활용에 대한 거부감이 적기 때문이다. 뉴욕 시는 오랫동안 맨홀 뚜껑이 폭발하는 사고 때문에 골치를 앓아왔다. 이에 미국의 통계학자 신시아 루딘은 뉴욕 시의 맨홀 5만1000개에 관련된 방대한 데이터로 예측 변수 106가지를 산출하고, 이를 바탕으로 터질 위험이 있는 맨홀을 예측했다. 그리고 이후 심각한 사고를 일으킨 맨홀의 44%가, 루딘이 지목한 ‘위험성 상위 10%’에 포함된 것으로 나타나 분석의 유용성이 입증되었다.

  
 


서울시도 뉴욕 시에 버금가는 빅 데이터 활용 행정을 시도하고 있다. 심야버스 노선을 확정하는 데 빅 데이터를 활용한 것이다. 발상은 간단했다. KT와 협조해 심야에 전화를 이용하는 사람들의 정보를 분석했다. 발신자 위치(출발지)와 번호 소유자의 주소지(도착지)를 연결하면 그가 심야에 이동해야 할 길이 나오기 때문이다. 이 데이터를 바탕으로 서울시는 기존 2개 심야버스 노선을 점검하고 새로운 노선을 확정했다(위의 그림 참조).

이 데이터에서 흥미로운 지점이 있었다. 서울 서초구나 강남구가 주소지인 사람이 강북에 심야까지 머무르는 빈도가 적다는 것이다. 강남 사람은 강북으로 술 마시러 가는 일이 드물다는 사실에 착안해 박원순 시장은 강남 지역 심야버스는 순환버스로 만들면 어떻겠느냐는 아이디어를 내놓기도 했다.

심야버스 노선에 이어 서울시가 계획 중인 또 다른 빅 데이터 프로젝트는 택시 위치정보와 택시 승객 위치정보를 결합하는 프로그램이다. 택시는 손님을 쉽게 발견하고 택시 이용자는 택시를 빨리 탈 수 있게 만드는 것이다. 김경서 서울시 정보기획단장은 “서울 택시의 공차율이 약 40%에 이른다. 100㎞를 운전하면 약 40㎞를 빈 차로 가는 것이다. 이를 빅 데이터를 활용해 개선할 수 있다”라고 말했다.

빅 데이터 분석이 중요한 또 다른 이유는 사회 변화를 파악할 수 있다는 점이다. 여기에는 사람들이 주로 이용하는 단어와 함께 언급되는 단어의 빈도수를 분석하는 ‘정량적 일상관찰기법’이 사용된다. 일종의 ‘주관의 객관화’ 과정인데, 사람들의 언어에 대한 일상적 관찰을 통해 ‘맥락화된 사회적 욕망’을 이해한다. 소셜 데이터 분석업체 미디컴의 윤미로씨는 “우리 사회가 점점 모계사회가 되고 있다는 것을 빅 데이터를 통해 파악할 수 있다. 예를 들어 최근에는 고모에 대해서 ‘불편하다’가 많은 대신 이모에 대한 언급은 ‘편안하다’ 쪽이 많다”라고 말했다.

빅 데이터를 통한 왕따 예방

강북삼성병원이 다음소프트와 함께 개발한 자살 예보 프로그램 역시 빅 데이터 기법에 기반했다(아래 그림 참조). 공동 연구팀은 실업률과 ‘우울’ ‘힘들다’ 등 부정적 단어의 언급량과 자살률이 동일한 패턴을 보인다는 것에 착안해 자살 예보 프로그램을 개발했다. 실업률과 부정적인 단어의 추이를 파악하면, 우리 사회 자살 위험이 얼마나 늘어날지 예측할 수 있다는 착상에서다. 이 조사 결과, 유명인 자살 직후 자살률이 급증하는 ‘베르테르 효과’ 역시 입증할 수 있었다.

빅 데이터를 잘 읽어내면 기업에 새로운 부가가치를 선사하기도 한다. 빅 데이터를 마케팅에 활용한 것으로 자주 인용되는 사례가 유유제약의 ‘멍 치료 연고’이다. 유유제약은 신제품 연고를 출시하면서 인터넷 데이터를 분석해 ‘벌레 물린 데’ ‘가려운 데’ 바르는 연고는 이미 타사 제품이 선점했다는 사실을 파악해 멍에 집중했다. 사람들이 멍과 관련해 언급하는 것이 달걀과 쇠고기라는 점을 파악하고 이를 광고에 활용한 것이다. 멍을 가장 고민하는 사람이 패션에 신경 쓰는 젊은 여성이라는 사실에 착안해 마케팅 전략을 짰다. ‘멍 치료 연고’의 판매 실적은 2012년 하반기 5개월 동안 98.6% 상승했다.

  
 


빅 데이터는 사람과 사람의 관계도 수치화해서 분석할 수 있게 해준다. 네트워크 이론 전문가 앨버트 라즐로 바라바시는 빅 데이터 분석을 통해 인맥에 관련된 중요한 사실을 알아냈다. 집단 내부 커뮤니케이션의 경우, 그룹 내 링크를 많이 가진 사람보다 외부의 다른 그룹과 링크를 가진 사람이 더 중요한 구실을 한다는 것이었다. 풀어서 말하면 친한 친구를 많이 가진 사람보다 친하지 않은 사람들과 연락이 닿는 사람이 훨씬 중요하다는 이야기다.

조기 퇴사 직원들 때문에 골머리를 앓았던 미국의 HP 사는 바라바시의 이론을 바탕으로 직원 관리 프로그램을 개발했다. 누가 조기 퇴사할 직원인지 알아내기 위해 직원 관계망을 분석한 것이다. 이를 바탕으로 회사 내 핵심 인재가 누구인지도 알 수 있었다. 한국의 빅 데이터 분석 전문기업 사이람도 이를 응용해서 회사의 핵심 인재가 누구인지, 소외된 직원이 누구인지 알아내는 프로그램을 만들었다.

사이람은 이 관계망 분석 프로그램을 응용해 우리 사회의 난제 해결을 위한 프로그램을 하나 개발했다. 바로 왕따 예방 프로그램이다. 사이람이 제작해 베타테스트(실험 운영) 중인 ‘교우관계 분석 프로그램’은 아이들 사이의 관계를 조사해 누가 소외되고 있는지를 알아낼 수 있다. 이 프로그램의 특징은 누가 왕따라고 지목하지 않아도 분석이 가능하다는 것이다.

<해운대> 성공, <타워> 실패의 이유


빅 데이터로 한국 사회를 들여다본다면 미래를 어떻게 예측할 수 있을까? 일단 ‘마천루 지수’를 주목할 만하다. ‘마천루 지수’란 초고층 건물이 많이 착공되면 호황기가 도래하지만, 완공될 즈음에는 불황으로 돌아선다는 내용으로 요약할 수 있다. 페트로나스 타워 건설 이후 말레이시아가, 101타워 건설 이후 타이베이가, 163층 버즈칼리파(버즈두바이) 완공 이후 아랍에미리트가 경험했던 일이다. 이에 따르면 세계에서 세 번째로 높은 건물이 된다는 롯데그룹 123층 건물이 완공될 즈음에는 경기가 더욱 나빠질지도 모른다.

 <div align=right><font color=blue>ⓒ시사IN 신선영</font></div>자살 방지 문구가 새겨진 마포 대교. 
ⓒ시사IN 신선영
자살 방지 문구가 새겨진 마포 대교.


우리 사회의 전반적 분위기는 어떻게 변화될까. 다음소프트가 분석한 자료를 보면 2011년부터 올해 상반기까지 한국인이 일상에 대해 가장 많이 사용한 표현은 ‘지치다’였다. 심지어 점점 증가한다는 점에서 불길하다. 사회경제학자 존 캐스티는 “불황이 찾아오고 부정적인 분위기가 조성되면 사람들은 재난 영화를 보고 싶어한다”라고 했다. 같은 블록버스터 재난 영화지만, 종합주가지수가 1500포인트였던 2009년 7월에 개봉한 <해운대>는 1000만 관객을 동원한 반면 종합주가지수가 2000포인트였던 2012년 12월에 개봉한 <타워>는 흥행에 실패했다. 이런 패턴이라면 종합주가지수가 하락세인 올여름에 개봉하는 <감기>는 흥행을 예상할 수 있다. 긍정적 사회 분위기에서 부정적 사회 분위기로 전환할 때 나타나는 또 하나의 현상은 대중문화계에 ‘좀비 열풍’이 분다는 것이다.

빅 데이터 관련 최고 권위자 중 한 명인 사회경제학자 존 캐스티는, ‘정치 지도자의 행동은 그들의 인기(사회적 분위기)를 어떻게 변화시키는가?’라는 질문을 “사회적 분위기가 정치 지도자에 대한 유권자들의 인식(인기)에 어떻게 영향을 미치는가”로 바꿀 필요가 있다고 주장했다. 여기서 하나의 가설을 세워볼 수 있다. 박근혜 대통령의 개별 통치 행위가 인기를 좌우하는 것이 아니라 전반적인 사회 분위기가 박 대통령의 인기를 결정한다는 것이다. 

박근혜 대통령의 인기 이유는?


보통 국가 지도자의 인기는 주가지수 그래프와 상관성이 높다. 그런데 국내 주가지수는 5월 한 달을 제외하고는 4월 이후 계속 내림세다. 이렇게 경제도 좋지 않고 사회적 분위기도 우울한 상황에서 박근혜 대통령의 지지율은 대단히 높은 수준에서 지속되고 있다. 이에 대해 빅 데이터 자료에 기반하면 두 가지 정도의 해석이 가능할 것 같다.

  
 


하나는, 박 대통령이 ‘잊혔기’ 때문이라는 유추다. 최근 문화체육관광부가 발표한 ‘빅 데이터 분석을 통해 본 2013 국민 인식변화’에 따르면, ‘박근혜 정부’에 대한 SNS 언급량과 뉴스 언급량은 정부 출범 이후 꾸준히 줄어들고 있다(위의 그림 참조). 장관들이 줄사퇴를 하는 등 이슈가 많을 때는 언급량이 많다가 4월 이후 급격히 감소한 것이다. 그런데 이 4월 이후 박근혜 대통령의 국정 수행 능력에 대한 평가는 ‘긍정’ 쪽이 점점 늘어나고 있다. 박근혜 정부에 대한 언급량과 대통령의 인기가 반비례하는, 거칠게 비유하자면 대통령이 국민에게 잊힐수록 인기가 높아진다고 할 수 있다.


다른 하나는, ‘사람들이 미래를 두려워하는 시기엔 대개 강한 지도자를 바라고, 자신감 및 안전감을 가졌던 과거에 향수를 느낀다’라는 ‘빅 데이터 격언’에서 도출할 수 있다. 국민들은 ‘약한 야당’보다 ‘강한 대통령’을 더 신뢰한다. 이를 역으로 민주당에 대입해보면 국민들은 새누리당이 아니라 대통령과 맞서는 ‘강한 야당’을 원한다는 것을 알 수 있다. 물론 경기 하락세에 대한 책임을 떠안지 않기 위해 민생을 챙겨야 하겠지만 말이다. 


출처 : 

빅 데이터’ 세계를 꿰뚫다

  • ‘빅 데이터’ 세계를 꿰뚫다

시사인

"전통적으로 기업은 인포메이션과 데이터 같은 형식적 유의미한 정보만 관리해왔습니다. 

그러나 스마트 기기가 비즈니스의 도구가 됐고 IoT 환경을 맞아 비즈니스 인사이트를 갖추려면 

모든 이벤트(event)들을 관리해야 합니다. 


형식적 유의미성을 갖지 않은 이벤트들 안에 이전에 발견하지 못한 많은 비즈니스 가치와 기회가 잠재돼 있거든요." 

(무의미한 이벤트들 안에서 비즈니스 가치와 기회를 잡는것)


기존 정보에 대한 분석 방법으로는 BRMS(Business Rule Management System)란 단일 이벤트 분석 기술로 충분했다.

그러나 오늘날 다양한 이벤트들이 발생하고 이를 연관 분석하고 지능화된 추론을 하려면 새로운 기술이 필요하다. 

(다양한 이벤트들간의 연관 분석 및 지능화된 추론 필요)


CEP(Complex Event Processing, 실시간 복합 이벤트 처리) 기반의 실시간 이벤트 분석기술이 바로 그것이다. 


실시간 엄청난 양으로 발생하는 이벤트에 어떻게 접근하느냐가 점점 중요해지고 있습니다. 

이벤트에 대한 실시간 패턴분석, 추론분석, 스트림 데이터 분석 등의 요구사항을 만족하기 위해서


 CEP 기반의 분석방법

- 가시성→이해→비즈니스 인사이트 추출


실시간 데이터에 대한 가시화를 통해 이벤트들 간 연관성과 패턴을 이해하고

그 이해를 바탕으로 실시간 기업환경에 필요한 직관성을 얻음으로써 

다양한 비즈니스 가치를 창출하는 과정이다. 


실시간 분석 관점의 CEP가 대세

- 팁코가 초당 수백만 쿼리를 처리할 수 있는 것은 인 메모리 기반의 분석 아키텍처를 활용하고 있기 때문입니다. 

초대규모 이벤트가 유입될 때 빠른 응답성을 보장하기 위해서는 실시간 분석에 대한 참조데이터를 보관하는 장소로서 IMDG(In Memory Data Grid)기술을 통해 모든 참조데이터를 메모리에 보관해야 합니다. 

팁코는 그리드 컴퓨팅 형태의 분산구조 아키텍처를 갖고 있기 때문에 특히 장애 대응이나 시스템 확장에 매우 유연한 특징을 보입니다." 



"빅데이터는 수많은 이벤트 속의 의미를 추출해 비즈니스에 이용할 수 있어야 한다"고


첫째, 작게 시작하라. 많은 비용을 들여 하둡에 엄청난 데이터를 '때려 넣는 것'은 무모하다. 

둘째, 주제 영역을 확실히 하라는 것이다. 분석 목적을 명확히 해 그에 맞는 분석 툴을 마련해야 한다. 

셋째, 실시간성에 초점을 맞추라는 점이다. 전통적인 데이터 배치방식으로는 변화무쌍한 비즈니스 환경에 적응할 수 없다.



[참조 : 디지털타임스]













+ Recent posts