반응형

[ 하둡 MR보다 스파크(SPARK)를 사용할 때 장점 ]

하둡MR보다 스파크(SPARK)를 사용했을 때의 대부분이 말하는 이점은 디스크 처리 기반에서 메모리 처리 기반으로 넘어오면서 연산처리 속도가 빨라졌다는 것이다.

뭐 틀린말은 아니지만 데이터 엔지니어 입장에서 뭔가 더 구체적으로 설명할 수 있어야 하지 않을까 하는 생각에 간단히 정리해 포스팅해본다.

1. 스파크(SPARK)의 연산 방식은 lazy evaluation으로 수행된다. 

Lazy evaluation(굳이 번역해 보자면 느긋한 연산 정도 되겠다)을 사용함으로써 action이 시작되는 시점에 트랜스포메이션(transformation)끼리의 연계를 파악해 실행 계획의 최적가 가능해진다. 사용자가 입력한 변환 연산들을 즉시 수행하지 않고 모아뒀다가 가장 최적의 수행 방법을 찾아 처리하는 장점을 가진다.
여기서 말하는 최적화란 대부분 지역성(locality)에 관한 것이다. 예를 들어 물건을 사오는 심부름을 시킬 때 A상점에서 파는 물건과 B상점에서 파는 물건을 따로따로 여러 번사오게 하는 것보다 필요한 물건을 한꺼번에 주문해서 한 번 방문했을 때 필요한 물건을 한 번에 사는 것이 효율적이기 떄문이다.

사실 fist() 액션에서도 스파크는 처음 일치하는 라인이 나올 때까지만 파일을 읽을 뿐 전체 파일을 읽거나 하지 않는다.

실제로 하둡 맵리듀스 같은 시스템에서는 맵리듀스의 데이터 전달 회수를 줄이기 위해 어떤 식으로 연산을 그룹화 할지 고민하느라 개발자들이 시간을 많이 빼앗기게 된다. 맵리듀스에서 연산 개수가 많다는 것은 곧 네트워크로 데이터를 전송하는 단계가 많아짐을 의미하고 그만큼 클러스터에 부하를 가져다 줄 수 있다. 스파크(SPARK)에서는 단순한 연산 들을 많이 연결해서 사용하는 것이나 하나의 복잡한 매핑 코드를 쓰는 것이나 큰 차이가 없는데 기본적으로 스파크에서 효율적인 계획을 세워서 수행하기 때문이다. 그렇다고 해서 rdd재사용 등을 고려하지 않고 아무렇게나 프로그래밍을 해도 된다는 의미는 아니다. 따라서 스파크 사용자들은 프로그램을 더 작게 만들고, 효율적인 연산의 코드를 만들어 내야 한다는 부담에서 좀 더 자유로울 수 있다.


2. RDD 재사용을 위한 캐싱 기능
기본적으로 메모리위에 캐싱을 하여 처리를 하게 되면 디스크 처리 기반의 MR작업보다 최소 10~20배 이상 빠를 수 밖에 없다. 여러 액션에서RDD 하나를 재사용하고 싶으면 RDD.persist()를 사용하여 계속 결과를 유지하도록 할 수 있다. 첫 연산이 이루어진 후 스파크는 RDD의 내용을 메모리에 저장하게 되며(클러스터의 여러 머신들에 나뉘어서) 이후의 액션들에서 재사용할 수 있게 된다.


3. RDD는 유연한 연산 방식을 제공한다.
분산 데이터로서의 RDD(Resilient Distributed Datasets)는 문자 그대로 해석하면 "회복력을 가진 분산 데이터 집합"으로  데이터를 처리하는 과정에서 집합을 이루고 있던 데이터의 일부에 문제가 생겨도 스스로 알아서 복구할 수 있다는 의미이다.  실제로 이것은 스파크(SPARK)가 RDD를 만들어 내는 방법을 기억하고 있기 때문에 가능한 것으로 스파크는 데이터의 일부가 유실되면 어딘가에 백업해둔 데이터를 다시 불러오는 것이 아니고 데이터를 다시 만들어내는 방식으로 복구를 수행하게 됩니다.


4. 코드 간결성 및 Interactive shell
하둡 MR을 해보신 분은 알겠지만 단어들을 aggregate하는 하둡 MR소스코드는 맵과 리듀스를 만들어주어야 하기 때문에 길고 복잡할 수 밖에 없는 반면에 스파크는 람다기반의 함수형 프로그래밍 기법으로코드가 매우 간단하며, interactive shell을 사용하여 실제 쉘에서 실시간으로 데이터 변화를 확인할 수 있다는 장점을 가지고 있습니다.


실제로 하둡 MR 대안으로 SQL을 MapReduce로 변환해주는 Hive 프로젝트가 있어 많은 사람이 잘 사용하고 있지만, 쿼리를 최적화하기가 어렵고 속도가 더 느려지는 경우가 많다는 어려움이 있다. 스파크는 이러한 단점들을 보안하며 위와 같은 장점들로 인해 분산 처리 툴로서 많은 관심과 사랑?을 받고 있다고 볼 수 있습니다.


반응형
반응형

빈약한 가슴운동을 했덨 날^^;;;(20170618)


인줄 알았는데 팔굽혀펴기를 300개나 했네!


딱보아하니 홈트레이닝으로 가슴운동 한 날~


그래도 일요일인데도 불구하고 운동도하고


식단도 하려고 노력했네~단백질 섭취가 아쉽긴 하지만


그래도 휴일에 열심히 한 나에게 칭찬을:)



반응형
반응형

오늘은 어깨운동 하는 날(20170616)


음...과거의 나를 회상하며 보는중...


지금에 비하면 확실히 무게가 약하긴 하다.


딱 네달 전인데 밀리터리 프레스는 10kg 정도 늘었네ㅎㅎ


이 때는 사이드레터럴 반복 횟수가 너무 아쉽다.


그래도 금요일임에도 불구하고 어깨운동한 나에게 칭찬을^^


욕심 부리지 말고 꾸준히 해서 어깨깡패가 되는 그날까지~




반응형
반응형

하체운동 하던 날(20170614)


그날 그날 올렸어야 했는데 지금껏 밀린관계로 회고식으로 작성해야겠다...


요즘은 하체운동을 거의 하지 않지만 이때도 그렇게 열심히 하지는 않았나보다.


하체는 일주일에 한 번씩은 하려고 노력중인데


자꾸 중간에 회식 & 약속이 끼다보면 하체할날에 못하고 


다시 상체운동으로 가게된다는...


붕어싸만코 반개 먹은 과거의 내가 귀엽다ㅋㅋ



반응형
반응형

오늘 읽었던 "언니의 독설" 중 맘에 와닿는 문구가 있어서 정리해본다.


----------------------------------------------------------------------------


1.  "사랑 표현이 부족하다고 괜찮은 남자 걷어차진 마" - 

나와 감성이 똑같지 않다는 이유로, 같은 시간에 같이 보고 싶어 하지 않는다는 이유로,

사랑의 표현 수준이 다소 처진다는 이유로 복을 걷어차는 일은 하지 마. 그런 실수는 10대나 하는 거야.

결혼을 전제로 성숙한 사랑을 의심한다면 누가 더 문제야? 여자 아니냐고.


----------------------------------------------------------------------------


2. 사랑의 무게와 짧은 문자 사이에 아무런 관계도 없다는 걸 깨달으면 '응'도 용서가 되는거야. -


----------------------------------------------------------------------------


3. "부부는 머리는 두 개에 몸통은 하나인 묘한 생명체" -

부부는 머리는 두개고 몸통은 하나인 묘한 생명체래. 그래서 누가 되었건 달콤한 꿀을 먼저 상대 입에 넣어주면 

내 몸이 달콤해지고 상대 입에 독을 넣어주면 결국 내 몸이 아프다는 거야. 그래서 둘 중 한 명만 현명해도 부부는 

그런대로 살아갈 수 있어. 부부 사이에 무조건 다 싸워서 승리해야 하는 건 아니야. 진짜 싸울 건 따로 있어.

하지만 이건 싸워서 쟁취할 문제가 아니고 알아들은 사람이 먼저 실천하면 되는 일이야.

하고 싶은 말이 있으면 몸을 비틀지 말고 말로 해. 말로 이해시키고 설득시키는 것도 아내의 실력이야.

만날 져주면 손해 아니냐고? 가족끼리도 손해 따지고 살면 숨 막혀서 세상을 어떻게 살아가겠니.

여자에서 아내라는 이름으로 산다는 것은 과거보다 두 배 더 현명해져야 한다는 뜻이야

----------------------------------------------------------------------------



책에서는 여자가 남자를 이해하라는 맥락에서 얘기했지만 남자에게도 동일하게 해당된다고 생각한다.

내가 사랑하는 여자가 내가 바랐던 행동이나 말을 하지 않더라도 사랑을 의심하지 말자. 

짧은 순간의 의심과 오해로 사랑하는 사람과의 관계를 망치고 싶지 않다면. 

서운한 감정이나 생각이 든다면 의심과 오해보다는 대화를 통해서 풀어나가도록 하자.




반응형
반응형

데이터 엔지니어로 살아가기 229일째(데이터야놀자 컨퍼런스 후기) 


오늘은 이틀전(20171013, 금요일)에 다녀온 '데이터야놀자' 컨퍼런스에 다녀온 후기에 대해서 작성하려고 한다.


먼저 '데이터야놀자' 컨퍼런스를 통해 크게 느낀점 네가지를 정리하자면 다음과 같다.

1. 나이와 관계없이 꿈이 있고 그 꿈을 향해 행동하고 있는 사람은 멋지다.

2.공부에는 끝이 없다. (요즘은 모든 분야, 직무에 해당되는 것 같다.)

3.'잘 모르겠다'라는 말도 누가 말했느냐에 따라 힘을 가질 수 있다.

4.나는 지금 내 꿈을 향해 잘 달려가고 있고 나도 충분히 연사가 될 수 있다.


하루 종일 30분 정도로 진행되는 11개의 세션들을 들으며 많은 생각이 들었지만 그 중 핵심적인 생각은 위의 4가지로 요약할 수 있을 것 같다.


먼저 '데이터야놀자'라는 컨퍼런스는 데이터를 다루는 사람들의 소통의 장을 마련하고 축제의 분위기를 만들고 싶어하는 것 같았다.


그에 따라 세션이후에는 공연도 준비가 되어있었고 다양한 종류의 간식거리 및 맥주를 무료 제공하였다.


내가 들은 11개의 세션 중 가장 기억에 남았던 3개의 세션에 대해서 얘기해보려고 한다.



먼저 첫 번째 세션은 라인게임즈의 '백정상'님이 발표했던 "쌓는다고 다 데이터인가? (로그 맛깔나게 쌓는 방법)" 이다.


세션의 주제를 잘 정해서인지 많은 수의 인원들이 해당 세션을 듣기 위해 자리를 빈틈없이 꽉꽉 채웠다.


역시 주제 선정이 중요성에 대해서 다시 한 번 느끼게 되었다.


해당 세션에서 그 동안 경험했던 타부서팀들과의 경험담을 유쾌하게 잘 설명해주셨고 무작정 쌓은 데이터들과 잘 선별해 쌓은 데이터의 차이를


쓰레기수거장과 분리수거통의 사진으로 비유해 설명해주신게 특히 맘에 와닿았다. 


한 마디로 요약하자면 '데이터를 쌓을 때 어떤 데이터를 어떻게 활용할 것인지에 대해 생각해보는 것이 중요하다'는 내용이 주를 이루었다.




인상깊었던 두 번째 세션은 카카오 선물하기 팀의 '전수현'님이 발표해준 "커머스 로그 통합 시스템"이였다.


여자 발표자 분이라서 그런지 발표하는 내내 상당히 부드러운 느낌을 많이 받았고 중간중간 떠는 모습, 거기에 대해 솔직하게 토로하시는 부분에 


해 굉장히 인간적인 면모를 많이 느꼈고 유쾌한 웃음과 솔직한 모습은 세션공간의 개발자들간의 경계를 많이 허물어 주셨다.


그리고 현재 내가 하고 있는 업무의 내용과 가장 비슷한 내용들이라서 더 집중하며 들었던 것 같다.


해당 세션에서 새롭게 알게 된 내용으로는 Apache Nifi가 있었는데 현재 우리 시스템에서 kafka to hdfs, monitoring을 담당해주는 새로운 대안


이 될 수 있을 것 같다는 생각이들었다. 



마지막 세번째 세션으로는 현재 구글에 계시는 조대협님의 '머신러닝 무엇이 중요한가?'라는 주제의 세션이였다.


솔직히 해당 세션에 대한 궁금증보다는 '조대협'님 자체가 너무 궁금했다. 개발을 하는 분이라면 한번쯤은 그의 블로그를 접해봤을거라는 생각이 


든다. 나 또한 하루에도 여러번 조대협 님의 블로그를 방문하고 글을 읽어 왔기 때문에 그 분의 말하는 방식 생각이 너무 궁금해 묻지도 따지지도 


고 해당 세션을 들었다. 블로그 글들만 봤을 때는 기술에만 관심있는 기술쟁이라는 생각이 들었지만 의외로 말씀도 굉장히 유쾌하게 하시고 


ppt구성이나 발표능력도 상당히 수준급이라는 느낌을 받았다. 그리고 항상 말에는 자신감이 있었고 질문을 하기 힘든 답변에는 시원하게 


'그건 해봐야 안다. 잘모르겠다'라는 말을 서스럼 없이 하는 모습에  신뢰감이 들었다...보통은 연사자가 저런 답을 하면 신뢰감이 떨어지기 


마련인데 그 동안 접해왔던 조대협님의 여러 기술을 주제로한 글들로 인해 '저 사람은 대단한 사람'이라는 생각이 이미 스며들었는지도 모른다.  


어찌되었든 조대협님 세션을 들으며 나도 그와 같이 추후에는 다른 기업에 '컨설팅'도 다니고 기술적인 부분에도 연사로 서있는 나의 모습을 


상상하게 되었다. 그러기 위해 꾸준히 학습하고 배우는 것들에 대한 블로깅, 끊임없이 배우려는 노력, 지속적인 목표 설정과 실천이 


가장 중요하다는 생각이 든다.


마지막으로 이번 '데이터야놀자' 컨퍼런스의 세션들을 들으며 기술적으로 학습해야겠다고 느낀 항목들을 적어본다.

1. Airflow

2. Elasticsearch, kibana(데이터 시각화 툴)

3. Apache Nifi

4. Google Api(Big query, vision api etc)


항상 이런 컨퍼런스들에 관심을 가지고 참여할 수 있도록 하자. 일상에 큰 활력을 불어넣어준 하루였다.


아! 그리고 마지막으로 '데이터야놀자' 세션을 들으며 스스로 다짐했던 내가 듣는 세션에 '질문 꼭 하나씩 하기' 목표를 실천해서 뿌듯하다:)



반응형
반응형

Dispalay 광고

디스플레이 광고 웹 배너의 형태 등으로 웹페이지에 나타나는 광고이다. 주로 배너들은 정적이거나 동적인 이미지와 더불어 다양한 동영상 요소들로 구성되며 점점 타겟팅화되어가고 있다. 쿠키와 브라우저 히스토리 등을 이용하여 타켓팅하는데 활용하고 있고 리타겟팅, 위치 기반 타겟팅 등 다양한 타겟팅 방법이 이용되어진다.

웹 배너

  • 애드 서버를 통해 www페이지에 제공하는 광고 형태
  • 일반적으로 이미지 또는 간단한 사운드와 영상이 포함된 형태로 제공됨
  • 사람들이 좋아하는 컨텐츠가 있는 페이지에 게제 됨
  • 특정 페이지의 트래픽(유저)을 광고주의 홈페이지로 랜딩시키는것이 기본 기능
  • 일반적으로 CPC방식으로 광고주에게 광고비가 지불됨

배너의 표준 사이즈(from 위키피디아)

스크린샷 2016-09-07 오전 11.22.46.png


[ Display Ads 산업에서 중요한 4가지 Player와 역할 ]

1. 퍼블리셔(Publisher)

  • 양질의 컨텐츠를 만들어서 사용자들을 해당 미디어로 이끌어 오는 역할
  • 수익을 극대화 하기 위해 상품의 공급량과 가격 등을 조절하며 공급하는 역할

2. 애드 네트워크 (AD network)

  • 다수의 광고미디어(퍼블리셔)를 네트워크로 묶어서 광고주에게 RON(Run of Network)으로 판매하는 업체를 뜻함

3. 광고주(Advertiser)

  • 광고 산업에 돈을 공급하는 아주 중요한 사람(혹은 회사, 단체)
  • 자사의 상품을 고객들에게 알리고, 자신의 브랜드 이미지를 개선하기 위해 광고를 만들어서 다양한 미디어를 통해 고객에게 노출시킨다.
  • 대형 광고주 : 다양한 매체에 광고를 집행하고 다양한 마케팅 이벤트와 광고를 통합하여 진행하기 떄문에 필연적으로 광고 대행사와 함께 일을 하게 된다.
  • 중소형 광고주 : 단순한 형태의 단일 광고를 집행하게 되므로 일반적으로 퍼블리셔에게 바로 컨택을 하거나, 퍼블리셔가 의존하는 애드 네트워크로 컨택을 하게 됨

4. 광고 대행사(AD agency)

  • 광고를 제작하는 일을 한다. (광고를 제작해주고 제작대행 수수료를 받음)
  • 매체 구매 대행 역할 수행 (매체 대행은 어느 매체에 얼마만큼의 광고를 송출 할 것인지 기획하고 해당 매체를 대신 구매해주는 역할)

[ 광고 거래의 진화 ]

AD Server 도입 이유

  1. 초창기
    광고주 -> 퍼블리셔 -> 유저
    > 문제점
    퍼블리셔측 : 퍼블리셔는 매번 광고주측에서 전달하는 광고를 페이지에 노출하기 위해 매번 html 페이지 수정, 광고 로테이션이 매우 힘듬
    광고주측 : 여러곳에 퍼블리싱하고 싶은 경우 모든 퍼블리셔들과 컨택해야하는 번거로움, 개별 사이트에 배너가 붙었는지 일일히 확인해야 하는 문제 등
  2. 이러한 문제점으로 퍼블리셔 측에서 AD SERVER 도입.
  3. 광고주 -> AD SERVER -> 퍼블리셔 -> 유저
    퍼블리셔 측 : 퍼블리셔는 페이지의 특정 영역을 따로 잡고 AD SERVER에 올라와 있는 광고 URL로 링크 연결해주면 되기 떄문에 페이지를 매번 수정할 필요가 없어졌고
    효율적으로 광고를 로테이션 할 수 있게 됨.
    광고주 측 : 광고주의 입장에서는 여러 퍼블리셔측의 AD SERVER에 광고를 업로드해야하는 문제가 남아있음
  4. 이를 해결하기 위해 광고주 측에서도 AD SERVER를 설치하게 됨
    광고주 -> AD SERVER(광고주 측) -> AD SERVER(퍼블리셔 측) -> 퍼블리셔 -> 유저
    광고주 측 : 자신들의 AD Server에만 광고를 올려두면 각각의 퍼블리셔 AD Server와 연결하여 호출되기 때문에 자신의 서버에 한번만 업로드 하면 되게됨. 또한 자신의 서버에서 광고송출 횟수 등을 통합 관리 할 수 있게 됨.
 [ 요약하자면, 퍼블리셔의 AD Server는 한 퍼블리셔가 다양한 광고주를 상대하고 광고를 로테이션 하기 위해 만들어졌고 광고주의 AD Server는 한 광고주가 다양한 퍼블리셔를 상대하기 위해 만들어짐 ]

AD Network

광고주와 퍼블리셔의 중간에서 효율적인 거래가 일어나도록 거래를 대행하는 역할 수행.
구체적으로는 양쪽 당사자의 영업과 거래를 위한 시스템 개발/운영이 주를 이룬다.
영업을 구체적으로 보자면 퍼블리셔에게 "쉬운 세팅, 높은 수익, 양질의 광고주 확보" 등을 홍보하며 퍼블리셔들이 홈페이지나 서비스에 자신의 애드네트워크 광고를 설정하도록 하며, 광고주들에게 "효율적인 광고 전달을 위한 양질의 퍼블리셔의 보유, 양질의 결과 리포팅, 합리적 가격" 등을 홍보하며 광고주들이 자신의 네트워크에 광고를 하도록 하는 것
시스템 개발/운영 측면에서는, 양쪽의 거래를 매칭 시킬수 있는 시스템과, 쉽게 거래할 수 있는 UI 등을 지속 발전 시키는 것이 포함


AD Network 수익모델

  1. 도매 가격에 사서 소매 가격에 파는 형태
  2. 도매로 이것저것 사와서, 비슷한 상품끼리 포장해서 비싸게 파는 형태 : 즉 타겟 고객별로 묶어서, 해당 타겟을 원하는 고객에게 좀더 매력적으로 만들어서 좀더 비싼 가격을 받는 형태
  3. 통계등을 기반으로 CPM으로 사와서 CPC를 통해 더 큰 수익 올리는 형태
    ex)
  4. 'A'라는 AD Network는 1,2,3,4라는 4명의 홈페이지 주인에게 광고 1000번 노출을 시키는 대가로 100원을 주기로 하고 계약 진행
  5. '고글'이라는 광고주는 스포츠 관련 홈페이지에 광고 1000번 노출할 경우 120원 지불하기로 하고 AD Network와 계약 진행
  6. AD Network는 스포츠 관련 홈페이지인 1,3번에 광고를 송출 합니다. 1번 페이지에서는 700번 노출이 되고, 2번 페이지에서는 300번 노출이 되었다고 할 때,
    광고주로부터 120원을 받아서, 1번 페이지에 70원을 주고 2번 페이지에 30원을 주고, AD Network는 20원을 남기게 된다.      
  7. 2016-09-07.jpeg


AD Network 문제점

퍼블리셔 입장에서는 자신의 컨텐츠와 연관성이 있는 광고주가 AD Network에 없을 수도 있고, 광고주의 입장에서도 자신이 거래하는 AD Network에 최적의 퍼블리셔가 있다고 확신하기 힘들다. 비슷한 예로는 주식 거래를 같은 증권사 고객들 끼리만 사고 팔게 되는 것과 같다. 이렇게 되면 거래 유동성이 많이 부족해 질 수 있어 문제가 된다. 그래서 이러한 문제를 해결하기 위해 AD Exchange가 등장을 하게 된다.

AD Exchange

AD Exchange 등장 배경 간략 정리

  1. AD Network에 광고 요청 광고주 5000명 - 페이지 접속 고객 10000명일 때 5000명에게 광고를 송출하지 못하는 경우가 생기게 됨 (거래 유동성)
  2. AD Network간에 인벤토리 거래가 시작됨
  3. 수 많은 AD Network간에 계약 후 거래시 연동관계가 복잡해지는 문제가 발생
  4. 가운데서 거래를 중재할 수 있는 AD Exchanges가 등장하게 됨.
스크린샷 2016-09-07 오후 5.12.00.png


AD Exchange 역할 및 기능

  • AD Exchange는 각각의 AD Network간 인벤토리 거래를 중재하는 역할을 하고 이로 인해 AD Network는 한개의 접점만으로 넉넉한 유동성을 확보 할 수 있게 된다.
  • AD Exchange는 수많은 거래를 처리해야 하기 때문에 고도의 트래픽 처리 능력과 다양한 AD Network와의 안정적인 연동 능력이 필수
  • 복잡한 거래형태 지원(ex, 거래 관련 부가 정보 제공 등)등을 갖추하여 함

DSP (Demand Side Platform)

DSP는 광고주들이 광고 위치를 구매하는 과정을 자동화하고 그들의 캠페인을 모니터링 하기 위해 사용하는 기술 집약적인 플랫폼

DSP 도입 배경

  1. 온라인 배너광고에 지출이 늘어갈 수록, 투자수익률(ROI)를 높일 수 있는 방법을 추구하게 됨
  2. RTB(Real Time Bidding)라는 형태의 거래가 생겨남
  3. 순간순간 유리하거나 광고주에게 적합한 인벤토리가 있을 때 마다 실시간으로 구매가 진행되게 됨
    ex) 맥주업체가 특정 스포츠 사이트에 광고를 통째로 사 놓기 보다, 그 사이트에 '어른으로 추정되는' 사용자가 접속할때만 광고를 사는 형태.
  4. '적합한' 인벤토리를 발견하는 데에는 다양한 데이터가 필요하고 그것을 제공하는 업체들이 필요하게 됨

DSP 필요 기능

  1. 단일 시스템 UI를 통한 다양한 Exchange와의 거래 제공
  2. RTB 기능 제공
  3. RTB를 서포트하기 위한(즉, 광고 ROI를 높이기 위한) 다양한 데이터 및 부가기능 제공
    (광고주 자체의 접속자 관련 데이터, Bidding 관련 다양한 옵션 설정 기능, 다양한 데이터를 통하여 광고 Impression의 가치를 계산하는 알고리즘 등)

SSP (Supply Side Platform)

매체들은 광고를 게시하기 위한 인벤토리를 제공한다. 프로그래매틱에서는 SSP를 통해 매체들이 광고 위치를 팔고 인벤토리 관리를 쉽게 할 수 있도록 도와준다.
SSP가 매체쪽에서 DSP와 같은 일을 한다고 생각하면 된다.

SSP 도입 배경

  1. 퍼블리셔의 입장의 경우 사이트는 하나라고 하더라도 여러가지 형태의 광고가 동시(여러형태의 배너)에 돌아가야 함
    2.많은 광고들로 인해 관리가 복잡해 짐
    3.퍼블리셔의 입장에서는 개별 AD Network에 접속해서 수익 정산 내역을 확인하는 것이 번거로움
    4.수익에 기반하여 실시간으로 탄력적 운영이 불가능하여 수익 극대화 전략을 펼치기가 힘듬

SSP의 역할

  1. 다양한 광고 Source의 통합 관리 UI
  2. RTB 연동 (Exchange, AD Network 중 RTB를 사용하는 업체와의 연동)
  3. 퍼블리셔 수익 최적화 기능

SSP의 전체 과정

스크린샷 2016-09-07 오후 6.05.40.png


[ DSP와 SSP 요약 ]

DSP : 광고주의 입장에서 편리하고 효율성 높은 광고 인벤토리를 구매하기 위해, RTB같은 기능과 다양한 부가데이터를 제공해주는 플랫폼으로써 등장

SSP : 퍼블리셔의 입장에서 다양한 광고주(AD Network, exchange등)를 편리하게 상대하고, 최고가의 광고를 판매해 수익을 극대화 하기 위한 플랫폼으로써 등장

DMP의 역할

DMP는 주로 다양한 소스의 데이터를 통합해서, 유저 또는 AD Impression에 대한 분석을 제공한다. 즉, 특정 퍼블리셔에서 광고 공간이 RTB 시스템에 나오게 되면, DSP들은 DMP에서 해당 AD Impression에 대해 자료를 얻고 그것을 바탕으로 입찰 금액을 정할 것입니다. 예를 들어 광고주가 한국의 맥주 회사인데, '한국의 20대 남성이고, 최근에 주류회사 사이트에 자주 방문함' 이런 형태의 정보를 받는다면 비싸게 입찰을 하게 될 것입니다.

DMP들이 정보소스 제공 받는 곳

1. 광고주 사이트
광고주 자신의 사이트에도 수많은 사람들이 방문을 할 것이고, 그들은 잠재 고객일 가능성이 높습니다. 따라서 그들에 대한 정보를 모으고, 쿠키등을 통해 그들의 행동 패턴이나, 구매 의도를 파악 하는 것은, 효과적인 광고를 위한 제 1의 데이터 원천입니다. DMP는 광고주의 사이트를 통한 데이터를 받아 통합적으로 분석하여 인사이트를 제공합니다.

2. Vertical Site
특징적인 사이트들의 방문자 정보를 통해서, 각각의 유저의 특성과 프로파일, 그리고 원하는 구매의도를 파악할 수 있게 된다. DMP들은 Vertical Ad Network나 개별 사이트들과 계약을 통해 해당 정보를 확보한다.

3. 제3의 정보제공자
특정 개인에 대한 프로파일 이외에도, 지역-IP정보 같은 제3의 데이터들을 통해 프로파일링을 도울 수 있다. 전문 정보제공업체로 부터 DMP는 데이터를 확보한다.



RTB 경매가 진행되는 과정

스크린샷 2016-09-07 오후 7.29.42.png
  1. X라는 유저가 특정 매체의 모바일 웹 페이지나 앱에 접속하는 즉시 광고 입찰 요청이 시작됩니다.
  2. X라는 유저의 기기 종류, IP 주소, 운영체제 등과 같은 정보가 매체의 앱이나 웹 페이지에 전달되어 이러한 정보를 활용할 수 있게 됩니다.
  3. 매체는 애드 익스체인지를 통해 해당 광고 위치를 입찰 가능하도록 합니다. 애드 익스체인지는 이 광고 위치에 입찰하고자 하는 모든 참여 광고주에게 알림을 보냅니다.
  4. 광고주는 DSP를 통해 X에 대한 정보를 받고 입찰 요청에 접근합니다. 취득된 정보를 바탕으로 광고주는 입찰가를 정하게 되죠. 예를 들어 X가 광고주의 광고와 연관성이 높다고 판단되면 높은 입찰가를 제시할 것입니다. 일단 입찰가가 정해지면 DSP는 광고주가 운영하고 있는 모든 캠페인을 조사해 어떤 광고가 이 X에게 가장 적합한지 찾아냅니다.
  5. 광고주를 대신해 DSP가 다른 입찰자들과 경쟁하여 비공개 입찰을 진행합니다.
    6.가장 높은 입찰가를 제시한 쪽이 낙찰을 받게 되고 매체의 웹 페이지나 앱에 있는 광고 위치를 차지하게 됩니다.


0.2초 RTB 광고가 시작-종료되는 시간

RTB 광고는 약 0.2초만에 완료됩니다. 입찰 요청이 시작되는 바로 그 순간부터 광고가 노출되는 모든 과정이 이 시간 안에 가능한 것이죠. 얼마나 짧은 시간인지 가늠해보기 위해 사람의 눈이 1번 깜박일때의 평균 시간(0.3초)과 비교해 봅시다. RTB 광고가 노출되는 그 복잡한 매커니즘이 여러분이 눈을 한번 깜빡이는 순간보다 빠르게 완료된다는 사실이 매우 놀랍지 않나요?

한 매체의 모바일 웹이나 앱에 방문하는 유저 X가 있다고 가정 합시다. X가 웹이나 앱에 방문하는 즉시 입찰 요청이 시작되는데, 이 때 X에 대한 특정 정보 (디바이스 종류, IP 주소, OS 등)를 활용할 수 있게 됩니다. 매체는 경매에 공개될 광고의 위치를 애드 익스체인지에 보내고 그와 동시에 해당 광고 위치에 입찰하고 있는 모든 업체들은 알림을 받습니다. 광고주는 방문하는 유저의 정보를 습득하고 입찰 요청을 보기 위해 DSP를 사용합니다. DSP가 광고 위치를 사기 위해 실시간으로 진행하는 입찰을 바탕으로 광고주는 퍼스트파티, 서드파티 데이터를 활용하여 X라는 유저가 타켓 오디언스 중 하나인지 아닌지 평가를 하는데 도움을 받습니다.

유저에 대한 정보를 바탕으로 광고주들은 캠페인을 관리하고 입찰가를 결정합니다. -- 이 유저가 광고에 반응할 확률이 높다고 생각되면 입찰가를 높게 설정할 수 있겠죠. 입찰가가 결정되고 나면 DSP는 이 광고주가 운영하고 있는 모든 캠페인을 확인해 보고 어떤 캠페인이 이 유저에 가장 적합한지 찾아냅니다. 광고주를 대신하여 DSP는 입찰을 진행하고 가장 높은 금액을 입찰한 광고주가 경매에서 이겨 매체의 모바일 웹이나 앱에 노출될 광고 위치를 낙찰받게 됩니다. 이러한 과정은 유저가 모바일 웹 페이지나 앱의 세션을 새로 시작할 때마다 반복됩니다.


REFERENCE 문서


반응형
반응형

[ 광고 필수 용어정리 ]

DA (Display Advertising)

포털사이트의 초기화면이나 각종 커뮤니티 사이트 등 홈페이지 내에 존재하는 슬롯을 통해 이미지 형태의 광고를 게재하는 형식.
대형 포털사이트에서 소형 커뮤니티사이트에 이르기까지 인터넷을 통해 진행 할 수 있는 온라인 광고의 가장 기본적인 방식
배너광고도 DA의 한 형태이며 일반적인 이미지 광고 및 동영상 광고와 다양한 효과를 줄 수 있는 리치미디어 광고를 활용할 수 있다.

SA (Search Advertising)

키워드 광고라고 하며, 네이버 등 포털 사이트에서 검색엔진으로 특정 키워드 검색 시 결과에 노출되는 광고를 말한다.
한 키워드에 여러 광고주가 광고요청을 한 경우 경쟁 입찰을 통해 노출 순위가 정해지기 때문에 검색수가 높은 키워드는 광고 비용이 크게 상승하기도 한다. 하지만 기본적으로 키워드 공략만 잘 하면 가장 효율적인 온라인 마케팅 방법으로 평가 받고 있다.

PV (Page View)

인터넷 이용자가 특정 홈페이지에 방문하여 둘러 본 페이지 수를 말한다.

UV (Unique Visitor)

인터넷 이용자가 특정 홈페이지에 방문한 수를 나타내며 중복 방문을 제외한 수치이다.
ex) 하루를 기준으로 할 때, A라는 특정인이 B라는 홈페이지를 오전 10시, 오후 2시, 오후 9시 총 3번 접속했다고 해도 카운트는 1로 나타나게 된다.

CPS (Click Per Sale)

구매가 발생했을 때 비용을 지불하는 방식으로 보통은 발생한 매출의 %만큼 광고비를 지불한다.
CPC와 비교하면 광고단가는 높은 편이지만, 발생한 매출에 대해서만 비용을 지불하므로 합리적일 수 있다.

CPC (Cost Per Click)

인터넷 검색으로 특정 키워드를 검색한 사람들을 대상으로 사이트가 노출되도록하는 키워드 광고용어
주로 매출, 회원가입과 같은 액션을 원할 때 보다는 많은 사람들의 방문에 중점을 둘 떄 적합한 광고
ex) 네이버에 원하는 키워드를 검색했을때 맨 앞쪽 상단에 뜨는 홈페이지들이 cpc광고에 해당
노출되는거와 상관없이 해당키워드 배너,홈페이지를 눌렀을때마다 비용이 나간다.

CPI (Click Per Install)

다운로드가 발생한 건마다 비용을 지불하는 방식
모바일시장, 특히 게임 업계에서 많이 사용하고 있는 광고 타입으로 일반 유저 입장에서 어플 다운로드라는 번거로운 액션이 발생해야 하기 때문에,
광고단가는 높은 편이다. 하지만 어플을 다운로드 하는 경우 푸쉬 발송과 같은 방법으로 유저를 관리할 수 있기 때문에 많은 광고주들이 어플 다운로드 수를 높이기 위해 CPI 광고를 진행한다.

CPA (Click Per Action)

원하는 액션(회원가입, 행동유도)이 발생했을 때마다 비용을 지불하는 방식
주로 구매릴 기준으로 삼지만 회원가입, 게임 다운로드 후 특정단계까지 달성하기 등이 전형적인 CPA광고라고 생각하면 된다.

CPV (Cost Per View)

광고 시청당 비용을 뜻하며 주로 유튜브나 네이버의 TV 캐스트와 같은 동영상 서비스 플랫폼에 주로 사용된다. 동영상 광고가 노출되면 무조건 과금되는 방식이 아니라 15초나 30초 등 일정시간 이상 광고를 시청해야 과금되며 광고 영상을 클릭하면 지정된 랜딩페이지로 이동한다.

CTA (Call To Action)

소비자의 반응을 유도하는 행위 또는 요소를 뜻하며 페이스북의 '좋아요'버튼이나 온라인 쇼핑몰의 구매하기 버튼 등이 모두 CTA를 위한 방법이다.

CPM (Click Per Mile)

광고가 1000번 노출 됐을 시의 금액을 뜻하며, 매체의 유명도와 매체 내 카테고리의 유입 정도에 따라 CPM 가격이 천차만별로 형성된다.

CPT (Click Per Time)

정해진 시간만틈 광고를 노출한 후 광고비를 지불하는 방식

CTR (Click Through Rate)

인터넷 상에서 배너가 하나 노출되었을 떄 클릭되는 횟수를 말한다.
배너가 100번 노출되었을 때 몇번이나 클릭을 하였는지를 의미
ex ) CTR 1%이면 100번 노출했을 때 한 번을 의미

MAU (Monthly Active Users)

한달 동안 해당 서비스를 이용한 순수 이용자의 수를 뜻한다. (DAU, Daily, Active Users와 같은 개념으로 기간만 늘어난 지표)

RTB (Real Time Bidding)

실시간 광고 입찰 시스템을 말한다. 온라인 광고 게재 시 가장 높은 가격을 제시한 광고주가 원하는 매체에 광고를 걸 수 있는 것이다.
현재 국내 모바일 시장에서 RTB에 대한 관심이 높아져가는 추세이다.

SEO (Search Engine Optimizaion)

검색 엔진 최적화를 나타내는 말로 검색엔진에서 검색을 했을 떄, 웹페이지가 검색 결과 상위에 노출될 수 있도록 관리하는 것이다.
검색엔진 최적화를 위해서는 꾸준한 포스팅, 독창적이고 질 좋은 콘텐츠 게시, SNS와의 연동 등의 방법이 있다.

랜딩페이지 (LandingPage)

키워드나 배너광고 등으로 유입된 이용자들을 마케팅 페이지에 다다르게하는걸 말한다.
ex) 지마켓,11번가등 쿠폰을 주겠다는 배너가 뜨고 그걸누르면 홈페이지 전체에 전화번호를 입력할 수 있는 창이 나오는데
그 페이지를 랜딩페이지라고한다.

어뷰징

어뷰징은 블로그, 지식인 등 정당하지 않은 방법으로 이득을 취할 떄 사용되는 단어로 온라인 마케팅을 할떄 클릭수를 조작하거나
같은 내용의 글들을 반복해서 전송하는 경우가 해당한다.

순위지수

순위지수는 광고의 품질을 나타내는 지수로 검색광고를 살펴보면 이 지수에 따라 광고 노출 순위가 선정된다.

[ 광고마케팅 용어 ]

퍼블리시티

광고주가 누구인지 모르게하는 pr 방법. 신문, 라디오 등 자연스럽게 하는 광고로
기업에서 제품광고를 할때 일정금액을 지불하고 유료광고를 하지만 퍼블리시티는 광고주의 의사와 관계없이 무료로
매체측의 계획에 의해 자유롭게 선전되는 방법

소셜타이징

소비자가 어떤 상품에 대한 광고를 제작 유통시키는 새로운 광고 형태 의미.
일반적으로는 기업에서 광고를 제작하지만 소셜타이징은 소비자가 자발적으로 광고제작과 유통에 참여한다

서비스마케팅

서비스를 통해 고객의 필요와 욕구를 충족시켜주는 기법
금융, 부동산, 여행, 통신 등 중요성이 강조됨에 따라 생긴 개념이라고 한다.

기상마케팅

시시각각 변화하는 정보를 활용하여 마케팅을 하는 기법으로 미리 예측된 기상변화를 제공받아 사업계획에 반영한다.
ex) 냉,난방기, 의류, 식류품 등의 업체들이 주로 사용하는 마케팅 기법

PPL

PPL은 영화나 드라마에서 등장하는 기법으로 영상내에 자연스럽게 특정상황이나 배우들을 통해 노출시키는 방법으로 시청자들로 하여금 갖고 싶다는 욕망을 불러일으키도록 하는 광고기법

코즈마케팅

기업과 사회적인 이슈를 연결하여 기업과 사회가 추구하는 것을 동시에 얻도록 하는 기법으로 화장품, 패션업계에서 활발히 진행중이다.
ex) 어떤 물건을 샀을 때 일정금액이 기부가 된다거나 하는 기법

리치미디어 광고 (Rich Media Advertising)

인터넷 또는 모바일의 배너 광고에 새로운 기술을 적용해 보다 풍부한 효과를 주는 형식의 광고를 말한다. 광고 위에 마우스를 올려놓거나 클릭을 하면 광고 이미지가 변하거나 동영상이 재생되는 등 이용자와 실시간 상호작용이 가능해 기존 방식의 광고에 비해 상대적으로 거부감은 낮고, 주목도와 클릭률은 높은 편이다.

[ 광고 효율 체크시 사용하는 단어 ]

ROAS(Return On Ads Spending) 광고수익률

광고주가 지출한 광고 비용 대비 발생한 매출로 적은 비용을 들여 매출이 많이 발생할 수록 비율이 높게 나타난다.
매출/광고비 x 100
ex) 소진된 광고비 : 100만원
발생 매출 : 300만원
300/100 x 100 = ROAS 300%

CVR(Conversion Rate) 전환율

전환은 광고 등을 통해 사이트를 방문한 사람이 제품 구매, 장바구니 담기, 회원가입, 뉴스레터 신청 등 광고주가 의도한 행위를 취하는 것을 뜻한다. 사이트에 방문한 방문자의 전환(상품구매, 회원가입 등)이 발생한 비율로 남자들이 주로 방문하는 중고차 거래 사이트에서 여성의류쇼핑몰
광고배너를 노출한다면 적절하지 못한 광고로 전환율은 매우 낮을 가능성이 높다.
전환수/ 유입수(방문수) x 100
ex) 상품구매 15명 / 방문자 500명 x 100 = CVR 3%

CTR(Click Through Rate) 클릭율

광고매체에 광고주의 광고가 노출된 횟수 대비 광고 클릭수를 의미
사람들의 흥미를 유발하는 광고배너/광고카피를 사용하거나, 매체를 방문하는 방문자의 성향에 맞는 광고를 노출하는 경우에는
CTR(클릭률)이 높일 수 있다.
클릭수/노출수 x 100
ex) 배너클릭 10명 / 배너노출 500 x 100 = CTR 2%

ROI(Return On Invest) 투자수익률

기업이 투자한 비용대비 발생한 순이익 비율
매출이 100만원에 순수익 10만원인 광고 A 와
매출이 1000만원에 순수익 10만원인 광고 B가 있다면
투자수익률은 A가 훨씬 좋다고 할 수 있다.
광고순수익/광고비 x 100
ex) 순수익 10만원 / 광고비 100만원 x 100 = ROI 10%

[ 광고 타겟팅 ]

타겟팅 광고 (Targeting Advertising)

일반적인 배너 광고들이 불특정 다수를 대상으로 노출되는 것과 다르게 특정 지역, 성별, 연령, 관심사 등 광고주가 원하는 특정 계층만을 상대로 노출하여 효율을 높이는 광고를 뜻한다. 타겟 설정을 위한 정보가 필요하기 때문에 기본적으로 로그인 기반의 매체에서 실행 할 수 있다.

리타겟팅 광고 (ReTargeting Advertising)

광고주의 웹사이트에 방문한 적이 있거나 웹사이트 내의 특정 페이지를 열람한 경험이 있는 소비자에게 광고를 보여주는 방법
ex) 소비자가 어느 코스메틱 기업 홈페이지를 방문했다가 다른 웹페이지로 옮겨가면 화장품과 관련된 광고가 나오는 식으로 쿠키 기반으로 실행되는 광고이기 때문에 쿠키가 지워질 경우 광고가 노출되지 않는 단점이 있다.

REFERENCE 문서


반응형
반응형

톰캣은 웹 애플리케이션을 어떻게 관리하는가?


톰캣은 한 번에 여러 개의 웹 애플리케이션을 실행할 수 있도록 설계되어 있다.

웹 애플리케이션은 배포 명세서 web.xml을 가진 WAR 파일로 정의되어 있다. 대개 서버는 하나의 톰캣 인스턴스를 실행하며 관련된 WAR 파일이 톰캣 인스턴스의 webapps 디렉터리에 설치된다. 이는 기본 설정이며 위치를 변경할 수 있다.


톰캣의 구성 요소들

톰캣은 몇 가지 구성 요소로 이루어져 있는데, 그중 하나가 서블릿 컨테이너와 JSP를 처리하는 것이다. 서블릿 컨테이너 구성 요소는 카탈리나(Catalina)라고 하며 JSP 구성 요소는 재스퍼(Jasper)라고 한다.


톰캠 사용 문서를 읽다 보면 이 이름들에 대한 참조를 쉽게 볼 수 있다. 예를 들어 결과 로그 파일의 기본 이름은 catalina.out이고, 톰캣 홈 디렉터리의 환경 변수는 $CATALINA_HOME이다.


기본으로 실행 중인 톰캣 인스턴스는 webapps 디렉터리에서 일어난 변화를 감지한다. 새 WAR 파일이 이 디렉터리에 저장되면 톰캣은 WAR 파일 이름에 대응하는 디렉터리에 파일 내용을 풀어놓고 컨텍스트의 애플리케이션을 해당 이름에 대응시킨다.


예를 들어 BookingApplication.war라는 WAR파일을 webapps 디렉터리에 배포하면 그 파일은 BookingApplication 디렉터리에 압축을 푼다. 톰캣은 WEB-INF 하위에 있는 web.xml 파일을 읽고 정의된 대로 애플리케이션을 실행하고 /BookingApplication 경로를 통해 클라이언트에게 제공한다.


이 접근 방법은 개발 방향을 빠르게 전환하는 데 상당히 유용하다. 지속해서 배포 할 수 있는 방법을 갖게 할 뿐만 아니라 접근할 수 있는 서버에 단위 테스트를 완료해 빌드된 WAR 파일을 자동으로 배포할 수 있으며 통합 테스트를 준비할 수 있기 때문이다. 테스트 범위가 충분하고 팀의 개발 프로세스가 가능하다면 실제 환경에도 자동으로 배포되게 할 수 있다.


# Reference - 자바프로그래밍 면접 이렇게 준비한다.

반응형

+ Recent posts