hot topic


인터넷에 맛집을 검색하여 갔는데 실망한 경험, 누구나 한 번쯤 있으시죠? 통통기자도 그럴듯한 사진과 현란한 소개 글이 담긴 광고성 포스팅에 속아 실망한 적이 한두 번이 아닙니다. 실제 맛집 후기와 광고성 글을 구분하기가 어렵기 때문에 이러한 일이 벌어지곤 하는데요, 이런 맛집 실패를 줄이기 위해 한동안 검색어에 ‘오빠랑’을 함께 쓰는 방법이 유행했습니다. 아래 그래프에서 확인할 수 있다시피 '오빠랑'에 대한 검색의 수가 2014년 이후로 급증하는 모습을 보였습니다. 이는 검색어에 ‘오빠랑’을 더하면 광고성 글이 아닌 실제 방문자, 특히 남자친구와 함께 방문한 여성들이 작성한 후기가 검색된다고 하여 너도나도 검색어에 ‘오빠랑’을 더하면서 나타난 검색 경향이었습니다. 


출처:네이버


그런데 어떻게 검색어에 ‘오빠랑’ 하나만 더하는 것으로 전혀 다른 결과들이 검색되는 걸까요? 검색의 메커니즘! 맛집과 ‘오빠랑’을 통해 소개해드리겠습니다!


출처: 본인


빠른 검색의 비밀: 색인(Index)


검색창에 검색어를 입력했을 때 컴퓨터가 어떻게 재빨리 관련 자료를 찾는지 궁금하지 않으셨나요? 그 비밀은 바로 색인에 있습니다. 만약 색인이 없다면 마치 우리가 먹고 싶은 메뉴가 어느 가게에서 파는지 몰라 가게마다 들어가 물어봐야 하듯이 컴퓨터도 모든 문서를 처음부터 끝까지 읽으면서 찾아야 한답니다. 그러나 색인이 있으면 어떤 단어가 어떤 문서에 들어있는지 알 수 있기 때문에 컴퓨터가 매우 빠르게 검색결과를 가지고 올 수 있습니다. 비유하자면 색인은 가게 밖에 있는 메뉴판과 같은 것이죠. 들어가지 않아도 무엇을 파는지 알 수 있으니까요. 색인에는 다양한 종류가 있는데요, 오늘은 두 가지 종류의 색인에 대해 알려 드리겠습니다!

색인을 더 쉽게 설명하게 예시를 들어볼게요. 예시는 제가 지금 먹고 싶은 파스타로 들어봤는데요, 한 데이터베이스 안에 문서가 이렇게 4개만 있다고 가정하고 두 가지의 색인을 보여드리겠습니다.



1. 있으면 1, 없으면 0!

컴퓨터의 기본 언어는 0과 1로 된 이진법이라는 거, 다들 아시죠~? 이와 비슷하게 한 문서에 해당 단어가 있으면 1, 없으면 0으로 표시하여 색인을 만들 수 있습니다. 이렇게 말로만 들어서는 어려우니 예시를 가지고 직접 색인을 만들어 보겠습니다. 



직접 보니 이해하기 쉽죠~? 문서에 해당 단어가 포함되어있으면 1의 값을, 포함되어있지 않으면 0의 값을 주면 된답니다. 이렇게 1과 0으로 표현된 색인을 용어-문헌 인접 행렬 (Term-document incidence matrix)이라고 부릅니다. 이러한 색인이 완성되면 단어마다 벡터의 값을 갖게 됩니다. 생소한 단어지만 벡터의 값은 간단하게 단어를 따라 가로로 읽어주면 됩니다. 즉, '파스타'는 1111, '오빠랑'은 0101의 값을 갖게 되는 것이죠. 이 벡터값은 밑에서 검색에 대입할 때 써보도록 할게요~


2. 포함된 번호만 쏙쏙!

색인을 만드는 또 다른 방법으로는 해당 단어가 포함되어 있는 문서 번호를 써주는 것입니다. 예시를 보면 '강남'은 문서 1과 문서 4에 있는 것을 확인할 수 있죠? 그럼 '강남' 옆에 1과 4만 써주면 된답니다. 나머지 단어에도 마찬가지로 적용하여 색인을 만들어 보면 아래와 같은 모양이 됩니다. 



이렇게 생긴 색인을 도치색인(Inverted index)라고 부릅니다. 각 단어가 어느 문서에 포함되어있는지 문서 번호로 표시만 해주면 도치색인 만들기 또한 어렵지 않죠? 도치색인은 용어-문헌 근접 행렬보다 각 단어가 어느 문서에 들어있는지 파악하기가 조금 더 쉽게 느껴지네요. 



색인을 이용한 검색


그렇다면 위에서 만든 용어-문헌 인접 행렬과 도치색인을 이용하여 검색을 해보겠습니다. 검색 엔진에서 가장 많이 사용되는 불리안 연산자 중 AND를 사용할 거예요. 불리안 연산자 AND가 무엇인지 모르신다면 교집합을 생각하시면 됩니다. 제가 알고 싶은 파스타 맛집을 광고성 글을 제외하기 위해 검색어 ‘파스타’와 ‘오빠랑’을 사용해보겠습니다. 

먼저 용어-문헌 인접 행렬의 경우 '파스타'의 벡터값인 1111과 '오빠랑'의 벡터값인 0101을 쓰고 이를 AND 연산자로 계산해줍니다. 말은 어렵지만 겹치는 것을 찾아주면 돼요! 그러면 '파스타 AND 오빠랑'의 벡터는 0101이 되겠죠~? 컴퓨터는 이를 인식하여 문서 2와 문서 4를 검색 결과로 제공하게 된답니다. 



다음으로 도치색인의 경우도 마찬가지로 각 단어의 색인에서 겹치는 부분을 가져오면 됩니다. 그렇다면 2와 4가 겹치니 위와 같이 문서 2와 문서 4가 검색되겠죠?




이렇게 '오빠랑'과 '파스타'의 검색결과를 찾아봤는데요, 그렇다면 '강남 AND 데이트'의 검색 결과는 어떻게 나올까요? 각각 용어-문헌 인접 행렬과 도치색인을 이용하여 정답을 아시는 분은 댓글에 남겨주세요~!




이렇게 두 가지 색인을 통해 검색의 메커니즘을 매우 간단하게 살펴보았습니다. 이제 검색어에 '오빠랑'이 들어갔을 때 어떻게 다른 검색 결과가 나오는지 이해가 가시나요~? 실제로는 이것보다 훨씬 더 복잡하고 다양한 방법으로 검색된답니다. 덧붙여 '내가 검색할 때는 AND를 쓰지 않았었는데?'라고 의문이 드는 분이 계신다면, 이는 검색 엔진 네이버에서 불리안 연산자가 아닌 다른 연산자를 사용하고 있기 때문이에요. 네이버에서는 '오빠랑 파스타' 만 입력하여도 중간에 AND가 있다고 보는 연산자를 사용하고 있답니다. 


혹시라도 이 기사를 보고 맛집 검색을 위해 검색어에 ‘오빠랑’을 써보려고 하시는 분이 계신다면 잠깐! 요즘에는 이러한 트렌드를 반영하여 광고성 후기에도 일부로 ‘오빠랑’을 집어넣는다고 해요. ‘오빠랑’보다는 ‘남편이랑’이 더 정확하다는 말이 있는데요, 이밖에 '짱맛' 또는 'X맛', '가성비 좋은' 등의 검색어는 어떨까요? 혹시 더 정확한 맛집 검색 방법을 알고 계신다면 통통기자에게 꼭 제보 부탁하겠습니다~! 




※ 본 글은 '통계청블로그기자단'의 기사로 통계청의 공식입장과 관계가 없습니다.

신고
트랙백 TRACKBACK :0 개, 댓글 14 개가 달렸습니다.
  • BlogIcon 이권식 2015.04.06 10:49 신고 ADDR EDIT/DEL REPLY

    우와! 정말 신기해요ㅋㅋㅋㅋㅋ

  • BlogIcon 찬우애비 2015.04.20 15:01 신고 ADDR EDIT/DEL REPLY

    야...통계라는 분야에 저런 신기한 내면이 숨어 있네요...ㅋ

  • BlogIcon 기미니 2015.04.20 15:16 신고 ADDR EDIT/DEL REPLY

    음마.. 학생기자인거 같은데 대단하네요~

  • BlogIcon 통계는 쉽지 않아 2015.04.20 17:00 신고 ADDR EDIT/DEL REPLY

    어렵긴하지만, 통계를 잘 분석하면 유용할것 같기는 합니다. 기자님 홧팅!!

  • BlogIcon 찬희애비 2015.04.20 17:26 신고 ADDR EDIT/DEL REPLY

    통계에 대한 생각이 새롭네요
    이롭게 활용하면 모두가 덕을 보고
    악용하면 한없이 오류에 빠질 수있는 학문이라고 생각해요
    검색분야에서 통계는 돈이 왔다갔다 하는 시장이죠 ~좋은 글 잘 읽었습니다 기자님 오늘도 화이팅입니다~

  • BlogIcon 불닭볶음면 2015.04.20 18:17 신고 ADDR EDIT/DEL REPLY

    강남과 데이트는 0001이겠네여!!! 도치색인을 시용하면 4!!! 맞나요?ㅋㅋㅋ

  • BlogIcon 차탱 2015.04.20 21:39 신고 ADDR EDIT/DEL REPLY

    통계를 전공하면서도 통계가 어렵고 딱딱하다고 생각했던 저를 스스로 반성하게끔 만드는 재밌고 색다른 기사네요! 박기자님 기사들이 통계에 대한 새로운 면을 잘 드러내고 있는것 같아서 재밌게 보고있답니다. 앞으로도 좋은 기사부탁드릴게요^^

  • BlogIcon 메론빙빙빙 2015.04.21 00:12 신고 ADDR EDIT/DEL REPLY

    쉽고 간단하게 설명해주셔서 감사합니다!!! 근데 사진 속 저 메론빙수는 어디서 파나요 ㅠㅠ 완전 취향 저격인데 ㅠㅠ

  • BlogIcon 김한나 2015.04.21 00:15 신고 ADDR EDIT/DEL REPLY

    검색이 이런 식으로 되는 거였군요! 신기신기

  • 강응수 2015.04.21 00:23 신고 ADDR EDIT/DEL REPLY

    X맛은 존맛인가요 ㅋㅋㅋㅋㅋㅋㅋㅋ

    • 최진혁 2015.04.21 00:29 신고 EDIT/DEL

      존맛 맞는 것 같아요ㅋㅋ 존맛 근데 은근 검색 잘 돼요ㅋㅋ

  • BlogIcon jhyn520 2015.04.21 02:52 신고 ADDR EDIT/DEL REPLY

    우와 진짜 신기하네요!!ㅋㅋ 검색이 이런원리였구나..

  • BlogIcon yw 2015.04.22 03:35 신고 ADDR EDIT/DEL REPLY

    존맛 ㅋㅋㅋㅋㅋㅋㅋ 좋은팁 얻어갑니다 ㅋㅋㅋㅋㅋㅋㅋㅋ

  • BlogIcon 워나 2015.04.22 14:10 신고 ADDR EDIT/DEL REPLY

    이렇게 검색하는군요~
    강남 1001
    데이트 0011
    겹치는 4번문서.



매일 점심시간이면 어김없이 찾아오는 갈등의 순간, 바로 메뉴 선택의 시간입니다. 오늘은 또 뭘 먹어야하나 고민되는 게 이만저만이 아닌데요, 순두부찌개는 어제 먹었고, 돈까스는 왠지 소화가 안 될 것 같고… 뭘 먹어야 잘 먹었다고 소문이 날지. 점심시간 메뉴판 앞에만 서면 작아지는 분들은 여기를 주목해주세요! 





2013년 한 해 동안 외식 소비형태를 살펴본 결과 소비자의 주방문 음식점은 한식이 71.2%로 가장 높았으며, 이는 2012년에 비해 약 3.2%가 증가한 비율입니다. 주문배달 부문에서는 2년 연속 치킨이 1위로 조사되었으며, 중식의 배달비중은 감소했지만 치킨은 꾸준히 증가하고 있다니 우리 국민들의 치킨 사랑이 어느 정도인지 알 수 있을 것 같네요. take-out 시에는 패스트푸드를 가장 선호하는 것으로 나타났으며, 분식과 김밥이 그 다음으로 높게 나왔습니다.





음식점 방문 시 인지경로는 주로 집이나 회사 주변을 지나다가 간판을 보고 들어가는 경우가 많았으며, 주변 지인을 통한 추천도 많은 수를 차지했습니다. 다만 전년대비 음식점 방문과 주문배달의 경우 '주변 지인 추천' 비율이 감소한 반면 '스마트폰 및 맛집 어플리케이션'과 '인터넷 맛집 블로그'를 통해서 인지하는 비율이 상당폭 증가한 것이 상당히 흥미롭습니다. 





최근에는 블로그를 통한 음식점 인지비율이 높아지면서 광고성 포스팅도 덩달아 비율이 급증했습니다. 이러한 현상으로 인해 최근 블로그에서 광고 없는 진정한 맛집을 찾기 위해서는 '오빠랑' 이라는 키워드로 검색하면 된다는 이야기가 화제가 되기도 했었죠~!





지난해 우리나라 국민이 가장 선호하는 음식으로는 음식점 방문 시 김치찌개가 1위를 차지했으며, 주문배달 시에는 치킨, 그리고 Take-out 상황에서는 햄버거가 가장 높은 비율을 차지했습니다. 음식점 방문 시에는 1위인 김치찌개의 뒤를 이어 백반, 한식, 육류구이, 삼겹살 등 한식이 대다수를 차지하는 것으로 나타났는데요, 역시 한국인은 밥심인 것같다는 생각이 드네요^.^! 점심 때 마다 어떤 메뉴를 먹어야 하나 너무 고민되신다면 여기에 나와 있는 메뉴들을 하나씩 지워가며 먹어보는 방법도 추천해드리고 싶습니다.





음식점 방문 시 선호하는 메뉴로 대다수를 차지했던 한식의 경우 '그 중에서도 구체적으로 어떤 음식점을 이용했는지'에 대한 질문에는 음식점 방문, 주문배달, Take-out 모두에서 일반 한식 전문점을 주로 이용하는 비율이 가장 높게 나타났습니다. 특히 주문배달은 일반한식을 이용하는 경우가 다른 이용형태에 비해 상대적으로 더 높았는데요, 이에 비해 국, 탕, 전골 및 찌개 전문점과 육류구이 전문점은 방문 시에 이용하는 경우가 상대적으로 다른 이용형태에 비해 높은 것으로 조사되었습니다. 국, 탕, 전골 및 찌개 종류 및 육류구이의 경우 간편하게 조리하기가 어려운 음식들이기 때문에 주문배달이나 Take-out보다는 방문 이용 비율이 높게 나타난 것으로 보입니다.




요즘은 먹는 방송, 일명 먹방이 대세라고 하죠? 그만큼 맛있는 음식이 사람들에게 얼마나 중요한 자리를 차지하고 있는지 알 것같은데요, 때론 맛있는 음식을 먹는 것만으로도 금세 행복해질 때가 있습니다. 그럼 위의 외식 선호메뉴 통계를 참고하셔서 맛있는 음식 드시고 오늘 하루도 힘내시길 통통이가 응원합니다! :-)



저작자 표시
신고
트랙백 TRACKBACK :0 개, 댓글 3 개가 달렸습니다.
  • sun 2014.03.07 14:46 신고 ADDR EDIT/DEL REPLY

    좋은 정보 감사합니다...그런데...통계청의 어떤 조사를 보면..이런통계들이 나오나요???

    • BlogIcon 통계청 2014.03.07 15:10 신고 EDIT/DEL

      한국외식산업연구원과 한국농수산식품유통공사의 <2013년 외식트렌드 조사용역 최종보고서>에 보면 확인 가능합니다! ^.^

  • BlogIcon 김승훈 2015.04.19 15:39 신고 ADDR EDIT/DEL REPLY

    좋은 정보 얻어주셔서 감사합니다.. 학교숙제 때문에 자료를 잠깐 참고하겠습니다...


티스토리 툴바