코어망 오프로딩을 소형셀 Local Caching -...

64
工學 碩士學位 論文 코어망 오프로딩을 위한 소형셀 Local Caching 알고리즘 Smallcell Local Caching Algorithm for Core Network Offloading 亞洲大學校 大學院 電 子 工 學 科

Transcript of 코어망 오프로딩을 소형셀 Local Caching -...

Page 1: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

工學 碩士學位 論文

코어망 오프로딩을 위한

소형셀 Local Caching 알고리즘

Smallcell Local Caching Algorithm

for Core Network Offloading

亞洲大學校 大學院

電 子 工 學 科

鄭 素 伊

코어망 오프로딩을 위한

소형셀 Local Caching 알고리즘

Smallcell Local Caching Algorithm

for Core Network Offloading

指 導 敎 授 金 宰 顯

이 論文을 工學 碩士學位 論文으로 提出함

2015 年 2 月

亞洲大學校 大學院

電 子 工 學 科

鄭 素 伊

i

감사의 글

대학원 생활은 아쉬움이 남지만 앞으로 나아감에 있어 지표가 되는 귀

중한 시간이었습니다 저를 포함한 모든 분들께 실망시키지 않고 후회 없는

삶을 살도록 노력하는 사람이 되겠습니다 논문이 완성될 수 있도록 도움을

주신 모든 분들께 이 글로서 감사한 마음을 전달하고자 합니다

먼저 부족한 저를 받아주시고 지난 2년간 대학원 생활을 하며 많은 격

려와 조언을 주신 김재현 교수님께 감사 드립니다 교수님의 가르침은 저를

성장시키는 큰 동력이 되었습니다 지도 교수님께 깊은 감사의 마음을 드립

니다 바쁘신 가운데에도 저의 부족한 석사학위 논문을 심사하고 지도해주

신 이교범 교수님과 김두환 교수님께도 진심으로 감사 드립니다

대학원 생활 동안 무선인터넷 연구실 선후배 동기가 있어서 큰 힘이

되었습니다 늘 저에게 아낌없는 도움이 있었기에 저 역시 많은 성장을 할

수 있었습니다 모든 분들께 감사 드립니다 앞으로도 소중한 시간 잊지 않

고 마음에 간직하겠습니다

마지막으로 저를 항상 응원해주시고 힘이 되어주시는 아버지와 어머니

그리고 사랑하는 동생 은이에게 언제나 감사 드리고 사랑한다는 말을 전하

고 싶습니다

2015년 2월

정소이

ii

국문 요약

모바일 네트워크 사용자의 트래픽 사용 용량과 요구 사항이 증가함에

따라 이를 처리하기 위한 방법으로 다양한 기술이 연구되고 있다 이 중 가

장 간단하면서도 효율적인 트래픽 처리 방안으로 소형셀 기술이 주목 받고

있다 소형셀 기술은 가용 단말기 수 증가와 데이터 전송 속도 향상을 통해

코어 네트워크의 트래픽 분산을 위한 핵심 요소로 소비자에게 새로운 서비

스를 제공해 주고 있다

특히 소형셀 내부에 캐시를 이용하면 코어망으로 전달되는 트래픽을 감

소시킬 뿐만 아니라 네트워크 비용을 감소시키고 통신의 성능을 증가시킬

수 있다 또한 백홀 링크가 혼잡하지 않은 시간에 데이터를 미리 캐시에 저

장함으로서 백홀 링크의 부하를 줄여줄 수 있다 본 논문에서는 소형셀 환

경에서 코어망 오프로딩을 위해 사용자의 context를 반영한 local caching 알고

리즘을 제안한다

일반적으로 한 소형셀에 접속한 사용자들은 같은 목적을 지니고 있거나

성향이 비슷할 확률 및 근접 소형셀 사용자 간의 유사도가 높다 이러한 소

형셀 특성을 활용해 각 소형셀 사용자 타겟에 적합한 데이터를 캐시에 저장

한다면 소형셀의 작은 캐시 용량으로도 충분히 성능을 높일 수 있다 본 논

문에서 제안하는 소형셀 local caching 알고리즘은 기존의 웹 캐시 방식에 비

해 소형셀과 소형셀 사용자들의 특성을 활용하는데 초점을 맞췄다 제안하

는 알고리즘의 요소에는 소형셀의 지역적인 특징과 소형셀 사용자 타겟에

따른 성향을 반영하였다 또한 제한된 소형셀 캐시 저장용량을 효율적으로

이용하기 위해 파일 크기를 예측하여 캐시 할당량을 조절하였다

실제 알고리즘이 소형셀에 적용되었을 경우 성능을 검증하기 위해 국내

포털 사이트의 검색어를 수집하여 행태 분석에 활용하였고 시뮬레이션의

iii

모든 환경은 실제 발생되는 트래픽 종류과 캐시 사이즈 등을 고려한 현실적

인 데이터 크기를 적용하였다

제안하는 알고리즘은 한정된 캐시 용량을 효율적으로 사용하고 고전적

인 웹 캐시 방식에 비해 캐시 적중률을 높였다 또한 코어망의 트래픽 감소

량을 나타내는 cache efficiency를 정의하고 제안한 알고리즘의 성능을 검증한

결과 기존 웹 캐시 방식에 비해 200의 성능 향상이 있었다 제안하는 알고

리즘은 캐시 기능을 보유한 소형셀에 탑재되어 향후 폭발적으로 증대될 트

래픽으로 인한 네트워크 부하를 감소시킬 것으로 기대된다

iv

목 차

제 1 장 서론 1

제 2 장 관련 연구 4

제 1 절 소형셀 포럼 연구 진행 상황 4

제 2 절 기존 웹 캐시 기술 5

제 3 절 소형셀 캐시 기술 8

제 1 항 소형셀 캐시 저장 시나리오 8

제 2 절 소형셀 캐시 알고리즘 14

제 3 장 소형셀 LOCAL CACHING 알고리즘 제안 16

제 1 절 Local caching 관점에서 소형셀 특징 16

제 2 절 Local caching 을 위한 네트워크 구조 19

제 3 절 소형셀 최적화 된 Local caching 알고리즘 22

제 4 장 성능 분석 30

제 1 절 소형셀 Local caching 환경 설계 30

제 1 항 소형셀 사용자 설계 30

제 2 항 캐시 설계 32

제 2 절 소형셀 Cache efficiency 모델링 36

제 3 절 시뮬레이션을 이용한 검증 40

제 5 장 결론 50

참고 문헌 51

ABSTRACT 54

v

그림 목차

그림 1 소형셀 포럼 연구 진행상황 4

그림 2 국부적 소형셀 캐시 저장 시나리오 9

그림 3 기업적 소형셀 캐시 저장 시나리오 10

그림 4 분산적 소형셀 캐시 저장 시나리오 12

그림 5 Urban 지역 소형셀 캐시 저장 시나리오 13

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조 19

그림 7 캐시 업데이트 정책 순서도 25

그림 8 실제 적용 예시 27

그림 9 소형셀 local caching 알고리즘 의사코드 28

그림 10 웹 브라우저 별 시장 점유율 32

그림 11 소형셀 캐시 효용성 모델링 36

그림 12 트래픽 별 크기 비율(TS=1 KS=1) 41

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1) 42

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1) 43

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1) 44

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1) 45

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1) 46

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234) 47

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15) 48

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23) 49

vi

표 목차

표 1 기지국 분류 2

표 2 Squid 최다 방문 사이트 18

표 3 LTE 엔티티와 인터페이스 주요 기능 20

표 4 의사코드에 적용된 파라미터 29

표 5 100 위 내 키워드 검색 건수 31

표 6 웹 브라우저 별 캐시 사이즈 33

표 7 웹 서비스 별 파일 크기 34

표 8 실제 적용 예시 34

표 9 검색어 별 파일 크기 35

표 10 알고리즘 효용성 검증 변수 37

표 11 시뮬레이션 환경 40

vii

약 어 표

LTE Long Term Evolution

QoE Quality of Experience

HetNet Heterogeneous Network

CoMP Coordinated Multi-Point transmission and reception

eICIC Enhanced Inter Cell Interference Coordination

CA Carrier Aggregation

MIMO Multiple Input Multiple Output

CAPEX CAPital EXpenditures

OPEX OPerating EXpenditure

URL Uniform Resource Locator

POP Point Of Presence

SON Self Organizing Network

URL Uniform resource locator

LRU Least Recently Used

LFU Least Frequently Used

SLRU Size-adjusted Least Frequently Used

LFU Aging Least Frequently Used Aging

GD Greedy Dual

LUV Least Unified Value

CW Criteria Weighted

FIFO First In First Out

UPP User Preference Profile

AUS Active User Set

viii

MLR Most Likely Requested video

SARG Squid Analysis Report Generator

SC-GW SmallCell-Gate Way

EPC Evolved Packet Core

MME Mobility Management Model

HSS Home Subscriber Server

NAS Non Access Control

EPS Evolved Packet System

S-GW Serving-Gate Way

P-GW Packet data network-Gate Way

PCRF Policy Charging Resource Function

TS Traffic Scenario

KS Keyword Scenario

1

제 1 장 서론

LTE (Long Term Evolution) 서비스의 급속한 확산에 따라 이동전화 가입자

수는 꾸준히 증가하고 있다 2014년 9월 기준 국내 3사 이동통신사의 LTE 가

입자 수는 3천 4백만 명을 넘어섰다[1] 이동통신사들의 네트워크 망이 고도

화됨에 따라 실시간 스트리밍 고화질 동영상 재생 등 과거 속도와 용량의

한계로는 불가능했던 서비스의 소비가 증가하였다 그 결과 LTE 서비스 가

입자는 3G 가입자보다 3배 많은 데이터를 사용하고 있다[2] CISCO의 자료에

의하면 2013년도 전 세계 연 평균 발생하는 모바일 데이터 트래픽은

18Ebytes를 기록하였다 트래픽은 향후 꾸준히 증가하여 2018년도에는 11배

가 증가한 1908Ebytes에 달할 것으로 전망된다[3]

모바일 사용자의 트래픽 요구 사항과 사용 용량이 증가함에 따라 한정

된 주파수 자원으로 많은 용량을 처리하기 위한 다양한 기술 개발이 진행

중이다 5G 무선통신 네트워크에서는 현재 사용되고 있는 4G 무선통신 네트

워크보다 높은 통신 용량 사용자 측면에서 향상된 QoE (Quality of Experience)

성능 향상된 에너지 효율 등을 요구한다 이러한 요구사항을 만족시키기 위

해 HeNet (Heterogeneous network) CoMP (Coordinated Multi-Point transmission and

reception) eICIC (Enhanced Inter-Cell Interference Coordination) CA (Carrier

Aggregation) Massive MIMO (Multiple Input Multiple Output) 등 다양한 기술 논의

가 활발히 이루어지고 있다[4]

특히 코어망의 과부하를 방지하고 고품질의 서비스를 제공하기 위해

HetNet (Heterogeneous Network)에 대한 관심이 높아지면서 HetNet의 핵심 구성

요소로서 소형셀의 역할이 증대되고 있다 HetNet은 매크로셀로 운영되어 오

던 기존의 네트워크 문제를 해결하는 방법으로 매크로셀 내에 소형셀을 혼

용하는 방식을 채택하였다 매크로셀이 넓은 커버리지와 높은 전송파워를 갖

는 반면 소형셀은 좁은 커버리지와 낮은 전송파워를 갖는다[5]

2

표 1 기지국 분류

Table 1 Classification of base station

indoor outdoor

펨토셀 피코셀 펨토셀 피코셀 마이크로셀 매크로셀

전송파워 10mW

~100mW

100mW

~250mW 900mW~1W 1~5W 5~10W 10W 이상

커버리지 100~200m 250~500m 500~700m 05~15km 1~3km 1~25km

평균크기 5times8cm 10times10cm 20times20cm 20times30cm 40times30cm 50times60cm

무게 1kg 15kg 2~3kg 2~4kg 4~6kg 10~15kg

최대

사용자수 8~16 명 16~64 명 8~32 명 16~64 명 64~256 명 256 명 이상

구축장소 가정 가정기업 가로등 벽 가로등 벽 옥상전신주 타워마스트

일반적으로 표 1과 같이 안테나당 10W급 이하 기지국 장비나 피코셀

펨토셀 등을 통칭해 소형셀이라 한다[5] 소형셀은 매크로셀에 비해 기지국

크기가 작아 공간 대비 인구가 밀집된 장소에 설치가 용이하다 CAPEX

(CAPital EXpenditures) 측면에서는 초기 설치비가 적게 들고 단기간에 설치가

가능하며 OPEX (OPerating EXpenditure) 측면에서는 추가적인 비용이 들지 않

고 전력소모가 작아 유지 비용이 적게 소요되는 장점이 있다[6]

CISCO의 시장 전망 분석에 의하면 모바일 기기에서 와이파이 및

소형셀 네트워크를 통해 오프로딩되는 모바일 트래픽은 계속 급증할 것으로

전망하고 있으며 2018년이 되면 모바일 네트워크 상에서 생성되는 트래픽을

능가할 것으로 예상하고 있다[3] 앞으로 소형셀은 매크로 셀을 보완하여 추

가적인 용량을 제공하는 기존 개념에서 발전하여 가정과 사무실에 독자적으

로 용량을 제공하여 모바일 네트워크의 핵심 요소로 자리매김 할 것으로 예

상된다 소형셀 포럼에서 발표한 2014년 3월 31일 기준 전세계 소형셀 배치

현황은 다음과 같다[7]

3

- 84 million smallcells overall

- 81 million residential femto cells

- 123000 enterprise smallcells

- 120000 indoor urban smallcells

- 6980 outdoor urban smallcells and

- More than 2050 rural smallcells are deployed worldwide

현재는 대부분의 소형셀이 주거용 펨토셀로 구성되어 있으며 앞으로 다

양한 종류의 소형셀 수가 증가할 것으로 전망하고 있다 전 세계적으로 소형

셀을 도입하는 사업자수가 빠르게 증가하고 있어 앞으로 소형셀은 소형셀

기지국 역할 뿐만 아니라 가정에서 인터넷 서비스의 중심이 될 것으로 예상

된다 이렇게 나날이 증대되는 소형셀 신규 서비스들이 발생시킬 트래픽들은

코어망의 부담을 가중시킬 수 있다 따라서 소형셀 환경에서 코어망 트래픽

집중을 방지하기 위한 트래픽 오프로딩 방안으로 캐싱에 대한 연구가 필요

하다 특히 소형셀 특징에 적합하게 코어망의 부하를 줄이기 위한 캐싱 기법

은 필요성과 개략적인 시나리오만 제시될 뿐 아직 구체적인 방법과 표준이

나오지 않아 연구가 시급하다

본 논문에서는 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하

를 감소시키는 하나의 방안으로 소형셀 환경에 최적화된 새로운 local caching

알고리즘을 개발하고자 한다 본 논문의 구성은 다음과 같다 2장에서는 소형

셀 포럼의 연구 진행 상황을 파악하고 기존 웹 캐시 방식과 최근 제안되는

소형셀 캐시 알고리즘에 대해 분석한다 3장에서는 local caching 관점에서 소

형셀 사용자 특성을 적용한 네트워크 구조를 도출하고 이를 반영한 새로운

local caching 알고리즘을 제안하였다 4장에서는 시뮬레이션 환경을 설계하고

성능 분석 모델링을 통한 성능을 평가하고 5장에서 결론을 맺는다

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 2: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

코어망 오프로딩을 위한

소형셀 Local Caching 알고리즘

Smallcell Local Caching Algorithm

for Core Network Offloading

指 導 敎 授 金 宰 顯

이 論文을 工學 碩士學位 論文으로 提出함

2015 年 2 月

亞洲大學校 大學院

電 子 工 學 科

鄭 素 伊

i

감사의 글

대학원 생활은 아쉬움이 남지만 앞으로 나아감에 있어 지표가 되는 귀

중한 시간이었습니다 저를 포함한 모든 분들께 실망시키지 않고 후회 없는

삶을 살도록 노력하는 사람이 되겠습니다 논문이 완성될 수 있도록 도움을

주신 모든 분들께 이 글로서 감사한 마음을 전달하고자 합니다

먼저 부족한 저를 받아주시고 지난 2년간 대학원 생활을 하며 많은 격

려와 조언을 주신 김재현 교수님께 감사 드립니다 교수님의 가르침은 저를

성장시키는 큰 동력이 되었습니다 지도 교수님께 깊은 감사의 마음을 드립

니다 바쁘신 가운데에도 저의 부족한 석사학위 논문을 심사하고 지도해주

신 이교범 교수님과 김두환 교수님께도 진심으로 감사 드립니다

대학원 생활 동안 무선인터넷 연구실 선후배 동기가 있어서 큰 힘이

되었습니다 늘 저에게 아낌없는 도움이 있었기에 저 역시 많은 성장을 할

수 있었습니다 모든 분들께 감사 드립니다 앞으로도 소중한 시간 잊지 않

고 마음에 간직하겠습니다

마지막으로 저를 항상 응원해주시고 힘이 되어주시는 아버지와 어머니

그리고 사랑하는 동생 은이에게 언제나 감사 드리고 사랑한다는 말을 전하

고 싶습니다

2015년 2월

정소이

ii

국문 요약

모바일 네트워크 사용자의 트래픽 사용 용량과 요구 사항이 증가함에

따라 이를 처리하기 위한 방법으로 다양한 기술이 연구되고 있다 이 중 가

장 간단하면서도 효율적인 트래픽 처리 방안으로 소형셀 기술이 주목 받고

있다 소형셀 기술은 가용 단말기 수 증가와 데이터 전송 속도 향상을 통해

코어 네트워크의 트래픽 분산을 위한 핵심 요소로 소비자에게 새로운 서비

스를 제공해 주고 있다

특히 소형셀 내부에 캐시를 이용하면 코어망으로 전달되는 트래픽을 감

소시킬 뿐만 아니라 네트워크 비용을 감소시키고 통신의 성능을 증가시킬

수 있다 또한 백홀 링크가 혼잡하지 않은 시간에 데이터를 미리 캐시에 저

장함으로서 백홀 링크의 부하를 줄여줄 수 있다 본 논문에서는 소형셀 환

경에서 코어망 오프로딩을 위해 사용자의 context를 반영한 local caching 알고

리즘을 제안한다

일반적으로 한 소형셀에 접속한 사용자들은 같은 목적을 지니고 있거나

성향이 비슷할 확률 및 근접 소형셀 사용자 간의 유사도가 높다 이러한 소

형셀 특성을 활용해 각 소형셀 사용자 타겟에 적합한 데이터를 캐시에 저장

한다면 소형셀의 작은 캐시 용량으로도 충분히 성능을 높일 수 있다 본 논

문에서 제안하는 소형셀 local caching 알고리즘은 기존의 웹 캐시 방식에 비

해 소형셀과 소형셀 사용자들의 특성을 활용하는데 초점을 맞췄다 제안하

는 알고리즘의 요소에는 소형셀의 지역적인 특징과 소형셀 사용자 타겟에

따른 성향을 반영하였다 또한 제한된 소형셀 캐시 저장용량을 효율적으로

이용하기 위해 파일 크기를 예측하여 캐시 할당량을 조절하였다

실제 알고리즘이 소형셀에 적용되었을 경우 성능을 검증하기 위해 국내

포털 사이트의 검색어를 수집하여 행태 분석에 활용하였고 시뮬레이션의

iii

모든 환경은 실제 발생되는 트래픽 종류과 캐시 사이즈 등을 고려한 현실적

인 데이터 크기를 적용하였다

제안하는 알고리즘은 한정된 캐시 용량을 효율적으로 사용하고 고전적

인 웹 캐시 방식에 비해 캐시 적중률을 높였다 또한 코어망의 트래픽 감소

량을 나타내는 cache efficiency를 정의하고 제안한 알고리즘의 성능을 검증한

결과 기존 웹 캐시 방식에 비해 200의 성능 향상이 있었다 제안하는 알고

리즘은 캐시 기능을 보유한 소형셀에 탑재되어 향후 폭발적으로 증대될 트

래픽으로 인한 네트워크 부하를 감소시킬 것으로 기대된다

iv

목 차

제 1 장 서론 1

제 2 장 관련 연구 4

제 1 절 소형셀 포럼 연구 진행 상황 4

제 2 절 기존 웹 캐시 기술 5

제 3 절 소형셀 캐시 기술 8

제 1 항 소형셀 캐시 저장 시나리오 8

제 2 절 소형셀 캐시 알고리즘 14

제 3 장 소형셀 LOCAL CACHING 알고리즘 제안 16

제 1 절 Local caching 관점에서 소형셀 특징 16

제 2 절 Local caching 을 위한 네트워크 구조 19

제 3 절 소형셀 최적화 된 Local caching 알고리즘 22

제 4 장 성능 분석 30

제 1 절 소형셀 Local caching 환경 설계 30

제 1 항 소형셀 사용자 설계 30

제 2 항 캐시 설계 32

제 2 절 소형셀 Cache efficiency 모델링 36

제 3 절 시뮬레이션을 이용한 검증 40

제 5 장 결론 50

참고 문헌 51

ABSTRACT 54

v

그림 목차

그림 1 소형셀 포럼 연구 진행상황 4

그림 2 국부적 소형셀 캐시 저장 시나리오 9

그림 3 기업적 소형셀 캐시 저장 시나리오 10

그림 4 분산적 소형셀 캐시 저장 시나리오 12

그림 5 Urban 지역 소형셀 캐시 저장 시나리오 13

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조 19

그림 7 캐시 업데이트 정책 순서도 25

그림 8 실제 적용 예시 27

그림 9 소형셀 local caching 알고리즘 의사코드 28

그림 10 웹 브라우저 별 시장 점유율 32

그림 11 소형셀 캐시 효용성 모델링 36

그림 12 트래픽 별 크기 비율(TS=1 KS=1) 41

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1) 42

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1) 43

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1) 44

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1) 45

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1) 46

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234) 47

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15) 48

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23) 49

vi

표 목차

표 1 기지국 분류 2

표 2 Squid 최다 방문 사이트 18

표 3 LTE 엔티티와 인터페이스 주요 기능 20

표 4 의사코드에 적용된 파라미터 29

표 5 100 위 내 키워드 검색 건수 31

표 6 웹 브라우저 별 캐시 사이즈 33

표 7 웹 서비스 별 파일 크기 34

표 8 실제 적용 예시 34

표 9 검색어 별 파일 크기 35

표 10 알고리즘 효용성 검증 변수 37

표 11 시뮬레이션 환경 40

vii

약 어 표

LTE Long Term Evolution

QoE Quality of Experience

HetNet Heterogeneous Network

CoMP Coordinated Multi-Point transmission and reception

eICIC Enhanced Inter Cell Interference Coordination

CA Carrier Aggregation

MIMO Multiple Input Multiple Output

CAPEX CAPital EXpenditures

OPEX OPerating EXpenditure

URL Uniform Resource Locator

POP Point Of Presence

SON Self Organizing Network

URL Uniform resource locator

LRU Least Recently Used

LFU Least Frequently Used

SLRU Size-adjusted Least Frequently Used

LFU Aging Least Frequently Used Aging

GD Greedy Dual

LUV Least Unified Value

CW Criteria Weighted

FIFO First In First Out

UPP User Preference Profile

AUS Active User Set

viii

MLR Most Likely Requested video

SARG Squid Analysis Report Generator

SC-GW SmallCell-Gate Way

EPC Evolved Packet Core

MME Mobility Management Model

HSS Home Subscriber Server

NAS Non Access Control

EPS Evolved Packet System

S-GW Serving-Gate Way

P-GW Packet data network-Gate Way

PCRF Policy Charging Resource Function

TS Traffic Scenario

KS Keyword Scenario

1

제 1 장 서론

LTE (Long Term Evolution) 서비스의 급속한 확산에 따라 이동전화 가입자

수는 꾸준히 증가하고 있다 2014년 9월 기준 국내 3사 이동통신사의 LTE 가

입자 수는 3천 4백만 명을 넘어섰다[1] 이동통신사들의 네트워크 망이 고도

화됨에 따라 실시간 스트리밍 고화질 동영상 재생 등 과거 속도와 용량의

한계로는 불가능했던 서비스의 소비가 증가하였다 그 결과 LTE 서비스 가

입자는 3G 가입자보다 3배 많은 데이터를 사용하고 있다[2] CISCO의 자료에

의하면 2013년도 전 세계 연 평균 발생하는 모바일 데이터 트래픽은

18Ebytes를 기록하였다 트래픽은 향후 꾸준히 증가하여 2018년도에는 11배

가 증가한 1908Ebytes에 달할 것으로 전망된다[3]

모바일 사용자의 트래픽 요구 사항과 사용 용량이 증가함에 따라 한정

된 주파수 자원으로 많은 용량을 처리하기 위한 다양한 기술 개발이 진행

중이다 5G 무선통신 네트워크에서는 현재 사용되고 있는 4G 무선통신 네트

워크보다 높은 통신 용량 사용자 측면에서 향상된 QoE (Quality of Experience)

성능 향상된 에너지 효율 등을 요구한다 이러한 요구사항을 만족시키기 위

해 HeNet (Heterogeneous network) CoMP (Coordinated Multi-Point transmission and

reception) eICIC (Enhanced Inter-Cell Interference Coordination) CA (Carrier

Aggregation) Massive MIMO (Multiple Input Multiple Output) 등 다양한 기술 논의

가 활발히 이루어지고 있다[4]

특히 코어망의 과부하를 방지하고 고품질의 서비스를 제공하기 위해

HetNet (Heterogeneous Network)에 대한 관심이 높아지면서 HetNet의 핵심 구성

요소로서 소형셀의 역할이 증대되고 있다 HetNet은 매크로셀로 운영되어 오

던 기존의 네트워크 문제를 해결하는 방법으로 매크로셀 내에 소형셀을 혼

용하는 방식을 채택하였다 매크로셀이 넓은 커버리지와 높은 전송파워를 갖

는 반면 소형셀은 좁은 커버리지와 낮은 전송파워를 갖는다[5]

2

표 1 기지국 분류

Table 1 Classification of base station

indoor outdoor

펨토셀 피코셀 펨토셀 피코셀 마이크로셀 매크로셀

전송파워 10mW

~100mW

100mW

~250mW 900mW~1W 1~5W 5~10W 10W 이상

커버리지 100~200m 250~500m 500~700m 05~15km 1~3km 1~25km

평균크기 5times8cm 10times10cm 20times20cm 20times30cm 40times30cm 50times60cm

무게 1kg 15kg 2~3kg 2~4kg 4~6kg 10~15kg

최대

사용자수 8~16 명 16~64 명 8~32 명 16~64 명 64~256 명 256 명 이상

구축장소 가정 가정기업 가로등 벽 가로등 벽 옥상전신주 타워마스트

일반적으로 표 1과 같이 안테나당 10W급 이하 기지국 장비나 피코셀

펨토셀 등을 통칭해 소형셀이라 한다[5] 소형셀은 매크로셀에 비해 기지국

크기가 작아 공간 대비 인구가 밀집된 장소에 설치가 용이하다 CAPEX

(CAPital EXpenditures) 측면에서는 초기 설치비가 적게 들고 단기간에 설치가

가능하며 OPEX (OPerating EXpenditure) 측면에서는 추가적인 비용이 들지 않

고 전력소모가 작아 유지 비용이 적게 소요되는 장점이 있다[6]

CISCO의 시장 전망 분석에 의하면 모바일 기기에서 와이파이 및

소형셀 네트워크를 통해 오프로딩되는 모바일 트래픽은 계속 급증할 것으로

전망하고 있으며 2018년이 되면 모바일 네트워크 상에서 생성되는 트래픽을

능가할 것으로 예상하고 있다[3] 앞으로 소형셀은 매크로 셀을 보완하여 추

가적인 용량을 제공하는 기존 개념에서 발전하여 가정과 사무실에 독자적으

로 용량을 제공하여 모바일 네트워크의 핵심 요소로 자리매김 할 것으로 예

상된다 소형셀 포럼에서 발표한 2014년 3월 31일 기준 전세계 소형셀 배치

현황은 다음과 같다[7]

3

- 84 million smallcells overall

- 81 million residential femto cells

- 123000 enterprise smallcells

- 120000 indoor urban smallcells

- 6980 outdoor urban smallcells and

- More than 2050 rural smallcells are deployed worldwide

현재는 대부분의 소형셀이 주거용 펨토셀로 구성되어 있으며 앞으로 다

양한 종류의 소형셀 수가 증가할 것으로 전망하고 있다 전 세계적으로 소형

셀을 도입하는 사업자수가 빠르게 증가하고 있어 앞으로 소형셀은 소형셀

기지국 역할 뿐만 아니라 가정에서 인터넷 서비스의 중심이 될 것으로 예상

된다 이렇게 나날이 증대되는 소형셀 신규 서비스들이 발생시킬 트래픽들은

코어망의 부담을 가중시킬 수 있다 따라서 소형셀 환경에서 코어망 트래픽

집중을 방지하기 위한 트래픽 오프로딩 방안으로 캐싱에 대한 연구가 필요

하다 특히 소형셀 특징에 적합하게 코어망의 부하를 줄이기 위한 캐싱 기법

은 필요성과 개략적인 시나리오만 제시될 뿐 아직 구체적인 방법과 표준이

나오지 않아 연구가 시급하다

본 논문에서는 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하

를 감소시키는 하나의 방안으로 소형셀 환경에 최적화된 새로운 local caching

알고리즘을 개발하고자 한다 본 논문의 구성은 다음과 같다 2장에서는 소형

셀 포럼의 연구 진행 상황을 파악하고 기존 웹 캐시 방식과 최근 제안되는

소형셀 캐시 알고리즘에 대해 분석한다 3장에서는 local caching 관점에서 소

형셀 사용자 특성을 적용한 네트워크 구조를 도출하고 이를 반영한 새로운

local caching 알고리즘을 제안하였다 4장에서는 시뮬레이션 환경을 설계하고

성능 분석 모델링을 통한 성능을 평가하고 5장에서 결론을 맺는다

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 3: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

i

감사의 글

대학원 생활은 아쉬움이 남지만 앞으로 나아감에 있어 지표가 되는 귀

중한 시간이었습니다 저를 포함한 모든 분들께 실망시키지 않고 후회 없는

삶을 살도록 노력하는 사람이 되겠습니다 논문이 완성될 수 있도록 도움을

주신 모든 분들께 이 글로서 감사한 마음을 전달하고자 합니다

먼저 부족한 저를 받아주시고 지난 2년간 대학원 생활을 하며 많은 격

려와 조언을 주신 김재현 교수님께 감사 드립니다 교수님의 가르침은 저를

성장시키는 큰 동력이 되었습니다 지도 교수님께 깊은 감사의 마음을 드립

니다 바쁘신 가운데에도 저의 부족한 석사학위 논문을 심사하고 지도해주

신 이교범 교수님과 김두환 교수님께도 진심으로 감사 드립니다

대학원 생활 동안 무선인터넷 연구실 선후배 동기가 있어서 큰 힘이

되었습니다 늘 저에게 아낌없는 도움이 있었기에 저 역시 많은 성장을 할

수 있었습니다 모든 분들께 감사 드립니다 앞으로도 소중한 시간 잊지 않

고 마음에 간직하겠습니다

마지막으로 저를 항상 응원해주시고 힘이 되어주시는 아버지와 어머니

그리고 사랑하는 동생 은이에게 언제나 감사 드리고 사랑한다는 말을 전하

고 싶습니다

2015년 2월

정소이

ii

국문 요약

모바일 네트워크 사용자의 트래픽 사용 용량과 요구 사항이 증가함에

따라 이를 처리하기 위한 방법으로 다양한 기술이 연구되고 있다 이 중 가

장 간단하면서도 효율적인 트래픽 처리 방안으로 소형셀 기술이 주목 받고

있다 소형셀 기술은 가용 단말기 수 증가와 데이터 전송 속도 향상을 통해

코어 네트워크의 트래픽 분산을 위한 핵심 요소로 소비자에게 새로운 서비

스를 제공해 주고 있다

특히 소형셀 내부에 캐시를 이용하면 코어망으로 전달되는 트래픽을 감

소시킬 뿐만 아니라 네트워크 비용을 감소시키고 통신의 성능을 증가시킬

수 있다 또한 백홀 링크가 혼잡하지 않은 시간에 데이터를 미리 캐시에 저

장함으로서 백홀 링크의 부하를 줄여줄 수 있다 본 논문에서는 소형셀 환

경에서 코어망 오프로딩을 위해 사용자의 context를 반영한 local caching 알고

리즘을 제안한다

일반적으로 한 소형셀에 접속한 사용자들은 같은 목적을 지니고 있거나

성향이 비슷할 확률 및 근접 소형셀 사용자 간의 유사도가 높다 이러한 소

형셀 특성을 활용해 각 소형셀 사용자 타겟에 적합한 데이터를 캐시에 저장

한다면 소형셀의 작은 캐시 용량으로도 충분히 성능을 높일 수 있다 본 논

문에서 제안하는 소형셀 local caching 알고리즘은 기존의 웹 캐시 방식에 비

해 소형셀과 소형셀 사용자들의 특성을 활용하는데 초점을 맞췄다 제안하

는 알고리즘의 요소에는 소형셀의 지역적인 특징과 소형셀 사용자 타겟에

따른 성향을 반영하였다 또한 제한된 소형셀 캐시 저장용량을 효율적으로

이용하기 위해 파일 크기를 예측하여 캐시 할당량을 조절하였다

실제 알고리즘이 소형셀에 적용되었을 경우 성능을 검증하기 위해 국내

포털 사이트의 검색어를 수집하여 행태 분석에 활용하였고 시뮬레이션의

iii

모든 환경은 실제 발생되는 트래픽 종류과 캐시 사이즈 등을 고려한 현실적

인 데이터 크기를 적용하였다

제안하는 알고리즘은 한정된 캐시 용량을 효율적으로 사용하고 고전적

인 웹 캐시 방식에 비해 캐시 적중률을 높였다 또한 코어망의 트래픽 감소

량을 나타내는 cache efficiency를 정의하고 제안한 알고리즘의 성능을 검증한

결과 기존 웹 캐시 방식에 비해 200의 성능 향상이 있었다 제안하는 알고

리즘은 캐시 기능을 보유한 소형셀에 탑재되어 향후 폭발적으로 증대될 트

래픽으로 인한 네트워크 부하를 감소시킬 것으로 기대된다

iv

목 차

제 1 장 서론 1

제 2 장 관련 연구 4

제 1 절 소형셀 포럼 연구 진행 상황 4

제 2 절 기존 웹 캐시 기술 5

제 3 절 소형셀 캐시 기술 8

제 1 항 소형셀 캐시 저장 시나리오 8

제 2 절 소형셀 캐시 알고리즘 14

제 3 장 소형셀 LOCAL CACHING 알고리즘 제안 16

제 1 절 Local caching 관점에서 소형셀 특징 16

제 2 절 Local caching 을 위한 네트워크 구조 19

제 3 절 소형셀 최적화 된 Local caching 알고리즘 22

제 4 장 성능 분석 30

제 1 절 소형셀 Local caching 환경 설계 30

제 1 항 소형셀 사용자 설계 30

제 2 항 캐시 설계 32

제 2 절 소형셀 Cache efficiency 모델링 36

제 3 절 시뮬레이션을 이용한 검증 40

제 5 장 결론 50

참고 문헌 51

ABSTRACT 54

v

그림 목차

그림 1 소형셀 포럼 연구 진행상황 4

그림 2 국부적 소형셀 캐시 저장 시나리오 9

그림 3 기업적 소형셀 캐시 저장 시나리오 10

그림 4 분산적 소형셀 캐시 저장 시나리오 12

그림 5 Urban 지역 소형셀 캐시 저장 시나리오 13

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조 19

그림 7 캐시 업데이트 정책 순서도 25

그림 8 실제 적용 예시 27

그림 9 소형셀 local caching 알고리즘 의사코드 28

그림 10 웹 브라우저 별 시장 점유율 32

그림 11 소형셀 캐시 효용성 모델링 36

그림 12 트래픽 별 크기 비율(TS=1 KS=1) 41

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1) 42

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1) 43

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1) 44

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1) 45

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1) 46

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234) 47

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15) 48

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23) 49

vi

표 목차

표 1 기지국 분류 2

표 2 Squid 최다 방문 사이트 18

표 3 LTE 엔티티와 인터페이스 주요 기능 20

표 4 의사코드에 적용된 파라미터 29

표 5 100 위 내 키워드 검색 건수 31

표 6 웹 브라우저 별 캐시 사이즈 33

표 7 웹 서비스 별 파일 크기 34

표 8 실제 적용 예시 34

표 9 검색어 별 파일 크기 35

표 10 알고리즘 효용성 검증 변수 37

표 11 시뮬레이션 환경 40

vii

약 어 표

LTE Long Term Evolution

QoE Quality of Experience

HetNet Heterogeneous Network

CoMP Coordinated Multi-Point transmission and reception

eICIC Enhanced Inter Cell Interference Coordination

CA Carrier Aggregation

MIMO Multiple Input Multiple Output

CAPEX CAPital EXpenditures

OPEX OPerating EXpenditure

URL Uniform Resource Locator

POP Point Of Presence

SON Self Organizing Network

URL Uniform resource locator

LRU Least Recently Used

LFU Least Frequently Used

SLRU Size-adjusted Least Frequently Used

LFU Aging Least Frequently Used Aging

GD Greedy Dual

LUV Least Unified Value

CW Criteria Weighted

FIFO First In First Out

UPP User Preference Profile

AUS Active User Set

viii

MLR Most Likely Requested video

SARG Squid Analysis Report Generator

SC-GW SmallCell-Gate Way

EPC Evolved Packet Core

MME Mobility Management Model

HSS Home Subscriber Server

NAS Non Access Control

EPS Evolved Packet System

S-GW Serving-Gate Way

P-GW Packet data network-Gate Way

PCRF Policy Charging Resource Function

TS Traffic Scenario

KS Keyword Scenario

1

제 1 장 서론

LTE (Long Term Evolution) 서비스의 급속한 확산에 따라 이동전화 가입자

수는 꾸준히 증가하고 있다 2014년 9월 기준 국내 3사 이동통신사의 LTE 가

입자 수는 3천 4백만 명을 넘어섰다[1] 이동통신사들의 네트워크 망이 고도

화됨에 따라 실시간 스트리밍 고화질 동영상 재생 등 과거 속도와 용량의

한계로는 불가능했던 서비스의 소비가 증가하였다 그 결과 LTE 서비스 가

입자는 3G 가입자보다 3배 많은 데이터를 사용하고 있다[2] CISCO의 자료에

의하면 2013년도 전 세계 연 평균 발생하는 모바일 데이터 트래픽은

18Ebytes를 기록하였다 트래픽은 향후 꾸준히 증가하여 2018년도에는 11배

가 증가한 1908Ebytes에 달할 것으로 전망된다[3]

모바일 사용자의 트래픽 요구 사항과 사용 용량이 증가함에 따라 한정

된 주파수 자원으로 많은 용량을 처리하기 위한 다양한 기술 개발이 진행

중이다 5G 무선통신 네트워크에서는 현재 사용되고 있는 4G 무선통신 네트

워크보다 높은 통신 용량 사용자 측면에서 향상된 QoE (Quality of Experience)

성능 향상된 에너지 효율 등을 요구한다 이러한 요구사항을 만족시키기 위

해 HeNet (Heterogeneous network) CoMP (Coordinated Multi-Point transmission and

reception) eICIC (Enhanced Inter-Cell Interference Coordination) CA (Carrier

Aggregation) Massive MIMO (Multiple Input Multiple Output) 등 다양한 기술 논의

가 활발히 이루어지고 있다[4]

특히 코어망의 과부하를 방지하고 고품질의 서비스를 제공하기 위해

HetNet (Heterogeneous Network)에 대한 관심이 높아지면서 HetNet의 핵심 구성

요소로서 소형셀의 역할이 증대되고 있다 HetNet은 매크로셀로 운영되어 오

던 기존의 네트워크 문제를 해결하는 방법으로 매크로셀 내에 소형셀을 혼

용하는 방식을 채택하였다 매크로셀이 넓은 커버리지와 높은 전송파워를 갖

는 반면 소형셀은 좁은 커버리지와 낮은 전송파워를 갖는다[5]

2

표 1 기지국 분류

Table 1 Classification of base station

indoor outdoor

펨토셀 피코셀 펨토셀 피코셀 마이크로셀 매크로셀

전송파워 10mW

~100mW

100mW

~250mW 900mW~1W 1~5W 5~10W 10W 이상

커버리지 100~200m 250~500m 500~700m 05~15km 1~3km 1~25km

평균크기 5times8cm 10times10cm 20times20cm 20times30cm 40times30cm 50times60cm

무게 1kg 15kg 2~3kg 2~4kg 4~6kg 10~15kg

최대

사용자수 8~16 명 16~64 명 8~32 명 16~64 명 64~256 명 256 명 이상

구축장소 가정 가정기업 가로등 벽 가로등 벽 옥상전신주 타워마스트

일반적으로 표 1과 같이 안테나당 10W급 이하 기지국 장비나 피코셀

펨토셀 등을 통칭해 소형셀이라 한다[5] 소형셀은 매크로셀에 비해 기지국

크기가 작아 공간 대비 인구가 밀집된 장소에 설치가 용이하다 CAPEX

(CAPital EXpenditures) 측면에서는 초기 설치비가 적게 들고 단기간에 설치가

가능하며 OPEX (OPerating EXpenditure) 측면에서는 추가적인 비용이 들지 않

고 전력소모가 작아 유지 비용이 적게 소요되는 장점이 있다[6]

CISCO의 시장 전망 분석에 의하면 모바일 기기에서 와이파이 및

소형셀 네트워크를 통해 오프로딩되는 모바일 트래픽은 계속 급증할 것으로

전망하고 있으며 2018년이 되면 모바일 네트워크 상에서 생성되는 트래픽을

능가할 것으로 예상하고 있다[3] 앞으로 소형셀은 매크로 셀을 보완하여 추

가적인 용량을 제공하는 기존 개념에서 발전하여 가정과 사무실에 독자적으

로 용량을 제공하여 모바일 네트워크의 핵심 요소로 자리매김 할 것으로 예

상된다 소형셀 포럼에서 발표한 2014년 3월 31일 기준 전세계 소형셀 배치

현황은 다음과 같다[7]

3

- 84 million smallcells overall

- 81 million residential femto cells

- 123000 enterprise smallcells

- 120000 indoor urban smallcells

- 6980 outdoor urban smallcells and

- More than 2050 rural smallcells are deployed worldwide

현재는 대부분의 소형셀이 주거용 펨토셀로 구성되어 있으며 앞으로 다

양한 종류의 소형셀 수가 증가할 것으로 전망하고 있다 전 세계적으로 소형

셀을 도입하는 사업자수가 빠르게 증가하고 있어 앞으로 소형셀은 소형셀

기지국 역할 뿐만 아니라 가정에서 인터넷 서비스의 중심이 될 것으로 예상

된다 이렇게 나날이 증대되는 소형셀 신규 서비스들이 발생시킬 트래픽들은

코어망의 부담을 가중시킬 수 있다 따라서 소형셀 환경에서 코어망 트래픽

집중을 방지하기 위한 트래픽 오프로딩 방안으로 캐싱에 대한 연구가 필요

하다 특히 소형셀 특징에 적합하게 코어망의 부하를 줄이기 위한 캐싱 기법

은 필요성과 개략적인 시나리오만 제시될 뿐 아직 구체적인 방법과 표준이

나오지 않아 연구가 시급하다

본 논문에서는 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하

를 감소시키는 하나의 방안으로 소형셀 환경에 최적화된 새로운 local caching

알고리즘을 개발하고자 한다 본 논문의 구성은 다음과 같다 2장에서는 소형

셀 포럼의 연구 진행 상황을 파악하고 기존 웹 캐시 방식과 최근 제안되는

소형셀 캐시 알고리즘에 대해 분석한다 3장에서는 local caching 관점에서 소

형셀 사용자 특성을 적용한 네트워크 구조를 도출하고 이를 반영한 새로운

local caching 알고리즘을 제안하였다 4장에서는 시뮬레이션 환경을 설계하고

성능 분석 모델링을 통한 성능을 평가하고 5장에서 결론을 맺는다

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 4: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

ii

국문 요약

모바일 네트워크 사용자의 트래픽 사용 용량과 요구 사항이 증가함에

따라 이를 처리하기 위한 방법으로 다양한 기술이 연구되고 있다 이 중 가

장 간단하면서도 효율적인 트래픽 처리 방안으로 소형셀 기술이 주목 받고

있다 소형셀 기술은 가용 단말기 수 증가와 데이터 전송 속도 향상을 통해

코어 네트워크의 트래픽 분산을 위한 핵심 요소로 소비자에게 새로운 서비

스를 제공해 주고 있다

특히 소형셀 내부에 캐시를 이용하면 코어망으로 전달되는 트래픽을 감

소시킬 뿐만 아니라 네트워크 비용을 감소시키고 통신의 성능을 증가시킬

수 있다 또한 백홀 링크가 혼잡하지 않은 시간에 데이터를 미리 캐시에 저

장함으로서 백홀 링크의 부하를 줄여줄 수 있다 본 논문에서는 소형셀 환

경에서 코어망 오프로딩을 위해 사용자의 context를 반영한 local caching 알고

리즘을 제안한다

일반적으로 한 소형셀에 접속한 사용자들은 같은 목적을 지니고 있거나

성향이 비슷할 확률 및 근접 소형셀 사용자 간의 유사도가 높다 이러한 소

형셀 특성을 활용해 각 소형셀 사용자 타겟에 적합한 데이터를 캐시에 저장

한다면 소형셀의 작은 캐시 용량으로도 충분히 성능을 높일 수 있다 본 논

문에서 제안하는 소형셀 local caching 알고리즘은 기존의 웹 캐시 방식에 비

해 소형셀과 소형셀 사용자들의 특성을 활용하는데 초점을 맞췄다 제안하

는 알고리즘의 요소에는 소형셀의 지역적인 특징과 소형셀 사용자 타겟에

따른 성향을 반영하였다 또한 제한된 소형셀 캐시 저장용량을 효율적으로

이용하기 위해 파일 크기를 예측하여 캐시 할당량을 조절하였다

실제 알고리즘이 소형셀에 적용되었을 경우 성능을 검증하기 위해 국내

포털 사이트의 검색어를 수집하여 행태 분석에 활용하였고 시뮬레이션의

iii

모든 환경은 실제 발생되는 트래픽 종류과 캐시 사이즈 등을 고려한 현실적

인 데이터 크기를 적용하였다

제안하는 알고리즘은 한정된 캐시 용량을 효율적으로 사용하고 고전적

인 웹 캐시 방식에 비해 캐시 적중률을 높였다 또한 코어망의 트래픽 감소

량을 나타내는 cache efficiency를 정의하고 제안한 알고리즘의 성능을 검증한

결과 기존 웹 캐시 방식에 비해 200의 성능 향상이 있었다 제안하는 알고

리즘은 캐시 기능을 보유한 소형셀에 탑재되어 향후 폭발적으로 증대될 트

래픽으로 인한 네트워크 부하를 감소시킬 것으로 기대된다

iv

목 차

제 1 장 서론 1

제 2 장 관련 연구 4

제 1 절 소형셀 포럼 연구 진행 상황 4

제 2 절 기존 웹 캐시 기술 5

제 3 절 소형셀 캐시 기술 8

제 1 항 소형셀 캐시 저장 시나리오 8

제 2 절 소형셀 캐시 알고리즘 14

제 3 장 소형셀 LOCAL CACHING 알고리즘 제안 16

제 1 절 Local caching 관점에서 소형셀 특징 16

제 2 절 Local caching 을 위한 네트워크 구조 19

제 3 절 소형셀 최적화 된 Local caching 알고리즘 22

제 4 장 성능 분석 30

제 1 절 소형셀 Local caching 환경 설계 30

제 1 항 소형셀 사용자 설계 30

제 2 항 캐시 설계 32

제 2 절 소형셀 Cache efficiency 모델링 36

제 3 절 시뮬레이션을 이용한 검증 40

제 5 장 결론 50

참고 문헌 51

ABSTRACT 54

v

그림 목차

그림 1 소형셀 포럼 연구 진행상황 4

그림 2 국부적 소형셀 캐시 저장 시나리오 9

그림 3 기업적 소형셀 캐시 저장 시나리오 10

그림 4 분산적 소형셀 캐시 저장 시나리오 12

그림 5 Urban 지역 소형셀 캐시 저장 시나리오 13

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조 19

그림 7 캐시 업데이트 정책 순서도 25

그림 8 실제 적용 예시 27

그림 9 소형셀 local caching 알고리즘 의사코드 28

그림 10 웹 브라우저 별 시장 점유율 32

그림 11 소형셀 캐시 효용성 모델링 36

그림 12 트래픽 별 크기 비율(TS=1 KS=1) 41

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1) 42

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1) 43

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1) 44

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1) 45

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1) 46

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234) 47

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15) 48

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23) 49

vi

표 목차

표 1 기지국 분류 2

표 2 Squid 최다 방문 사이트 18

표 3 LTE 엔티티와 인터페이스 주요 기능 20

표 4 의사코드에 적용된 파라미터 29

표 5 100 위 내 키워드 검색 건수 31

표 6 웹 브라우저 별 캐시 사이즈 33

표 7 웹 서비스 별 파일 크기 34

표 8 실제 적용 예시 34

표 9 검색어 별 파일 크기 35

표 10 알고리즘 효용성 검증 변수 37

표 11 시뮬레이션 환경 40

vii

약 어 표

LTE Long Term Evolution

QoE Quality of Experience

HetNet Heterogeneous Network

CoMP Coordinated Multi-Point transmission and reception

eICIC Enhanced Inter Cell Interference Coordination

CA Carrier Aggregation

MIMO Multiple Input Multiple Output

CAPEX CAPital EXpenditures

OPEX OPerating EXpenditure

URL Uniform Resource Locator

POP Point Of Presence

SON Self Organizing Network

URL Uniform resource locator

LRU Least Recently Used

LFU Least Frequently Used

SLRU Size-adjusted Least Frequently Used

LFU Aging Least Frequently Used Aging

GD Greedy Dual

LUV Least Unified Value

CW Criteria Weighted

FIFO First In First Out

UPP User Preference Profile

AUS Active User Set

viii

MLR Most Likely Requested video

SARG Squid Analysis Report Generator

SC-GW SmallCell-Gate Way

EPC Evolved Packet Core

MME Mobility Management Model

HSS Home Subscriber Server

NAS Non Access Control

EPS Evolved Packet System

S-GW Serving-Gate Way

P-GW Packet data network-Gate Way

PCRF Policy Charging Resource Function

TS Traffic Scenario

KS Keyword Scenario

1

제 1 장 서론

LTE (Long Term Evolution) 서비스의 급속한 확산에 따라 이동전화 가입자

수는 꾸준히 증가하고 있다 2014년 9월 기준 국내 3사 이동통신사의 LTE 가

입자 수는 3천 4백만 명을 넘어섰다[1] 이동통신사들의 네트워크 망이 고도

화됨에 따라 실시간 스트리밍 고화질 동영상 재생 등 과거 속도와 용량의

한계로는 불가능했던 서비스의 소비가 증가하였다 그 결과 LTE 서비스 가

입자는 3G 가입자보다 3배 많은 데이터를 사용하고 있다[2] CISCO의 자료에

의하면 2013년도 전 세계 연 평균 발생하는 모바일 데이터 트래픽은

18Ebytes를 기록하였다 트래픽은 향후 꾸준히 증가하여 2018년도에는 11배

가 증가한 1908Ebytes에 달할 것으로 전망된다[3]

모바일 사용자의 트래픽 요구 사항과 사용 용량이 증가함에 따라 한정

된 주파수 자원으로 많은 용량을 처리하기 위한 다양한 기술 개발이 진행

중이다 5G 무선통신 네트워크에서는 현재 사용되고 있는 4G 무선통신 네트

워크보다 높은 통신 용량 사용자 측면에서 향상된 QoE (Quality of Experience)

성능 향상된 에너지 효율 등을 요구한다 이러한 요구사항을 만족시키기 위

해 HeNet (Heterogeneous network) CoMP (Coordinated Multi-Point transmission and

reception) eICIC (Enhanced Inter-Cell Interference Coordination) CA (Carrier

Aggregation) Massive MIMO (Multiple Input Multiple Output) 등 다양한 기술 논의

가 활발히 이루어지고 있다[4]

특히 코어망의 과부하를 방지하고 고품질의 서비스를 제공하기 위해

HetNet (Heterogeneous Network)에 대한 관심이 높아지면서 HetNet의 핵심 구성

요소로서 소형셀의 역할이 증대되고 있다 HetNet은 매크로셀로 운영되어 오

던 기존의 네트워크 문제를 해결하는 방법으로 매크로셀 내에 소형셀을 혼

용하는 방식을 채택하였다 매크로셀이 넓은 커버리지와 높은 전송파워를 갖

는 반면 소형셀은 좁은 커버리지와 낮은 전송파워를 갖는다[5]

2

표 1 기지국 분류

Table 1 Classification of base station

indoor outdoor

펨토셀 피코셀 펨토셀 피코셀 마이크로셀 매크로셀

전송파워 10mW

~100mW

100mW

~250mW 900mW~1W 1~5W 5~10W 10W 이상

커버리지 100~200m 250~500m 500~700m 05~15km 1~3km 1~25km

평균크기 5times8cm 10times10cm 20times20cm 20times30cm 40times30cm 50times60cm

무게 1kg 15kg 2~3kg 2~4kg 4~6kg 10~15kg

최대

사용자수 8~16 명 16~64 명 8~32 명 16~64 명 64~256 명 256 명 이상

구축장소 가정 가정기업 가로등 벽 가로등 벽 옥상전신주 타워마스트

일반적으로 표 1과 같이 안테나당 10W급 이하 기지국 장비나 피코셀

펨토셀 등을 통칭해 소형셀이라 한다[5] 소형셀은 매크로셀에 비해 기지국

크기가 작아 공간 대비 인구가 밀집된 장소에 설치가 용이하다 CAPEX

(CAPital EXpenditures) 측면에서는 초기 설치비가 적게 들고 단기간에 설치가

가능하며 OPEX (OPerating EXpenditure) 측면에서는 추가적인 비용이 들지 않

고 전력소모가 작아 유지 비용이 적게 소요되는 장점이 있다[6]

CISCO의 시장 전망 분석에 의하면 모바일 기기에서 와이파이 및

소형셀 네트워크를 통해 오프로딩되는 모바일 트래픽은 계속 급증할 것으로

전망하고 있으며 2018년이 되면 모바일 네트워크 상에서 생성되는 트래픽을

능가할 것으로 예상하고 있다[3] 앞으로 소형셀은 매크로 셀을 보완하여 추

가적인 용량을 제공하는 기존 개념에서 발전하여 가정과 사무실에 독자적으

로 용량을 제공하여 모바일 네트워크의 핵심 요소로 자리매김 할 것으로 예

상된다 소형셀 포럼에서 발표한 2014년 3월 31일 기준 전세계 소형셀 배치

현황은 다음과 같다[7]

3

- 84 million smallcells overall

- 81 million residential femto cells

- 123000 enterprise smallcells

- 120000 indoor urban smallcells

- 6980 outdoor urban smallcells and

- More than 2050 rural smallcells are deployed worldwide

현재는 대부분의 소형셀이 주거용 펨토셀로 구성되어 있으며 앞으로 다

양한 종류의 소형셀 수가 증가할 것으로 전망하고 있다 전 세계적으로 소형

셀을 도입하는 사업자수가 빠르게 증가하고 있어 앞으로 소형셀은 소형셀

기지국 역할 뿐만 아니라 가정에서 인터넷 서비스의 중심이 될 것으로 예상

된다 이렇게 나날이 증대되는 소형셀 신규 서비스들이 발생시킬 트래픽들은

코어망의 부담을 가중시킬 수 있다 따라서 소형셀 환경에서 코어망 트래픽

집중을 방지하기 위한 트래픽 오프로딩 방안으로 캐싱에 대한 연구가 필요

하다 특히 소형셀 특징에 적합하게 코어망의 부하를 줄이기 위한 캐싱 기법

은 필요성과 개략적인 시나리오만 제시될 뿐 아직 구체적인 방법과 표준이

나오지 않아 연구가 시급하다

본 논문에서는 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하

를 감소시키는 하나의 방안으로 소형셀 환경에 최적화된 새로운 local caching

알고리즘을 개발하고자 한다 본 논문의 구성은 다음과 같다 2장에서는 소형

셀 포럼의 연구 진행 상황을 파악하고 기존 웹 캐시 방식과 최근 제안되는

소형셀 캐시 알고리즘에 대해 분석한다 3장에서는 local caching 관점에서 소

형셀 사용자 특성을 적용한 네트워크 구조를 도출하고 이를 반영한 새로운

local caching 알고리즘을 제안하였다 4장에서는 시뮬레이션 환경을 설계하고

성능 분석 모델링을 통한 성능을 평가하고 5장에서 결론을 맺는다

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 5: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

iii

모든 환경은 실제 발생되는 트래픽 종류과 캐시 사이즈 등을 고려한 현실적

인 데이터 크기를 적용하였다

제안하는 알고리즘은 한정된 캐시 용량을 효율적으로 사용하고 고전적

인 웹 캐시 방식에 비해 캐시 적중률을 높였다 또한 코어망의 트래픽 감소

량을 나타내는 cache efficiency를 정의하고 제안한 알고리즘의 성능을 검증한

결과 기존 웹 캐시 방식에 비해 200의 성능 향상이 있었다 제안하는 알고

리즘은 캐시 기능을 보유한 소형셀에 탑재되어 향후 폭발적으로 증대될 트

래픽으로 인한 네트워크 부하를 감소시킬 것으로 기대된다

iv

목 차

제 1 장 서론 1

제 2 장 관련 연구 4

제 1 절 소형셀 포럼 연구 진행 상황 4

제 2 절 기존 웹 캐시 기술 5

제 3 절 소형셀 캐시 기술 8

제 1 항 소형셀 캐시 저장 시나리오 8

제 2 절 소형셀 캐시 알고리즘 14

제 3 장 소형셀 LOCAL CACHING 알고리즘 제안 16

제 1 절 Local caching 관점에서 소형셀 특징 16

제 2 절 Local caching 을 위한 네트워크 구조 19

제 3 절 소형셀 최적화 된 Local caching 알고리즘 22

제 4 장 성능 분석 30

제 1 절 소형셀 Local caching 환경 설계 30

제 1 항 소형셀 사용자 설계 30

제 2 항 캐시 설계 32

제 2 절 소형셀 Cache efficiency 모델링 36

제 3 절 시뮬레이션을 이용한 검증 40

제 5 장 결론 50

참고 문헌 51

ABSTRACT 54

v

그림 목차

그림 1 소형셀 포럼 연구 진행상황 4

그림 2 국부적 소형셀 캐시 저장 시나리오 9

그림 3 기업적 소형셀 캐시 저장 시나리오 10

그림 4 분산적 소형셀 캐시 저장 시나리오 12

그림 5 Urban 지역 소형셀 캐시 저장 시나리오 13

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조 19

그림 7 캐시 업데이트 정책 순서도 25

그림 8 실제 적용 예시 27

그림 9 소형셀 local caching 알고리즘 의사코드 28

그림 10 웹 브라우저 별 시장 점유율 32

그림 11 소형셀 캐시 효용성 모델링 36

그림 12 트래픽 별 크기 비율(TS=1 KS=1) 41

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1) 42

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1) 43

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1) 44

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1) 45

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1) 46

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234) 47

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15) 48

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23) 49

vi

표 목차

표 1 기지국 분류 2

표 2 Squid 최다 방문 사이트 18

표 3 LTE 엔티티와 인터페이스 주요 기능 20

표 4 의사코드에 적용된 파라미터 29

표 5 100 위 내 키워드 검색 건수 31

표 6 웹 브라우저 별 캐시 사이즈 33

표 7 웹 서비스 별 파일 크기 34

표 8 실제 적용 예시 34

표 9 검색어 별 파일 크기 35

표 10 알고리즘 효용성 검증 변수 37

표 11 시뮬레이션 환경 40

vii

약 어 표

LTE Long Term Evolution

QoE Quality of Experience

HetNet Heterogeneous Network

CoMP Coordinated Multi-Point transmission and reception

eICIC Enhanced Inter Cell Interference Coordination

CA Carrier Aggregation

MIMO Multiple Input Multiple Output

CAPEX CAPital EXpenditures

OPEX OPerating EXpenditure

URL Uniform Resource Locator

POP Point Of Presence

SON Self Organizing Network

URL Uniform resource locator

LRU Least Recently Used

LFU Least Frequently Used

SLRU Size-adjusted Least Frequently Used

LFU Aging Least Frequently Used Aging

GD Greedy Dual

LUV Least Unified Value

CW Criteria Weighted

FIFO First In First Out

UPP User Preference Profile

AUS Active User Set

viii

MLR Most Likely Requested video

SARG Squid Analysis Report Generator

SC-GW SmallCell-Gate Way

EPC Evolved Packet Core

MME Mobility Management Model

HSS Home Subscriber Server

NAS Non Access Control

EPS Evolved Packet System

S-GW Serving-Gate Way

P-GW Packet data network-Gate Way

PCRF Policy Charging Resource Function

TS Traffic Scenario

KS Keyword Scenario

1

제 1 장 서론

LTE (Long Term Evolution) 서비스의 급속한 확산에 따라 이동전화 가입자

수는 꾸준히 증가하고 있다 2014년 9월 기준 국내 3사 이동통신사의 LTE 가

입자 수는 3천 4백만 명을 넘어섰다[1] 이동통신사들의 네트워크 망이 고도

화됨에 따라 실시간 스트리밍 고화질 동영상 재생 등 과거 속도와 용량의

한계로는 불가능했던 서비스의 소비가 증가하였다 그 결과 LTE 서비스 가

입자는 3G 가입자보다 3배 많은 데이터를 사용하고 있다[2] CISCO의 자료에

의하면 2013년도 전 세계 연 평균 발생하는 모바일 데이터 트래픽은

18Ebytes를 기록하였다 트래픽은 향후 꾸준히 증가하여 2018년도에는 11배

가 증가한 1908Ebytes에 달할 것으로 전망된다[3]

모바일 사용자의 트래픽 요구 사항과 사용 용량이 증가함에 따라 한정

된 주파수 자원으로 많은 용량을 처리하기 위한 다양한 기술 개발이 진행

중이다 5G 무선통신 네트워크에서는 현재 사용되고 있는 4G 무선통신 네트

워크보다 높은 통신 용량 사용자 측면에서 향상된 QoE (Quality of Experience)

성능 향상된 에너지 효율 등을 요구한다 이러한 요구사항을 만족시키기 위

해 HeNet (Heterogeneous network) CoMP (Coordinated Multi-Point transmission and

reception) eICIC (Enhanced Inter-Cell Interference Coordination) CA (Carrier

Aggregation) Massive MIMO (Multiple Input Multiple Output) 등 다양한 기술 논의

가 활발히 이루어지고 있다[4]

특히 코어망의 과부하를 방지하고 고품질의 서비스를 제공하기 위해

HetNet (Heterogeneous Network)에 대한 관심이 높아지면서 HetNet의 핵심 구성

요소로서 소형셀의 역할이 증대되고 있다 HetNet은 매크로셀로 운영되어 오

던 기존의 네트워크 문제를 해결하는 방법으로 매크로셀 내에 소형셀을 혼

용하는 방식을 채택하였다 매크로셀이 넓은 커버리지와 높은 전송파워를 갖

는 반면 소형셀은 좁은 커버리지와 낮은 전송파워를 갖는다[5]

2

표 1 기지국 분류

Table 1 Classification of base station

indoor outdoor

펨토셀 피코셀 펨토셀 피코셀 마이크로셀 매크로셀

전송파워 10mW

~100mW

100mW

~250mW 900mW~1W 1~5W 5~10W 10W 이상

커버리지 100~200m 250~500m 500~700m 05~15km 1~3km 1~25km

평균크기 5times8cm 10times10cm 20times20cm 20times30cm 40times30cm 50times60cm

무게 1kg 15kg 2~3kg 2~4kg 4~6kg 10~15kg

최대

사용자수 8~16 명 16~64 명 8~32 명 16~64 명 64~256 명 256 명 이상

구축장소 가정 가정기업 가로등 벽 가로등 벽 옥상전신주 타워마스트

일반적으로 표 1과 같이 안테나당 10W급 이하 기지국 장비나 피코셀

펨토셀 등을 통칭해 소형셀이라 한다[5] 소형셀은 매크로셀에 비해 기지국

크기가 작아 공간 대비 인구가 밀집된 장소에 설치가 용이하다 CAPEX

(CAPital EXpenditures) 측면에서는 초기 설치비가 적게 들고 단기간에 설치가

가능하며 OPEX (OPerating EXpenditure) 측면에서는 추가적인 비용이 들지 않

고 전력소모가 작아 유지 비용이 적게 소요되는 장점이 있다[6]

CISCO의 시장 전망 분석에 의하면 모바일 기기에서 와이파이 및

소형셀 네트워크를 통해 오프로딩되는 모바일 트래픽은 계속 급증할 것으로

전망하고 있으며 2018년이 되면 모바일 네트워크 상에서 생성되는 트래픽을

능가할 것으로 예상하고 있다[3] 앞으로 소형셀은 매크로 셀을 보완하여 추

가적인 용량을 제공하는 기존 개념에서 발전하여 가정과 사무실에 독자적으

로 용량을 제공하여 모바일 네트워크의 핵심 요소로 자리매김 할 것으로 예

상된다 소형셀 포럼에서 발표한 2014년 3월 31일 기준 전세계 소형셀 배치

현황은 다음과 같다[7]

3

- 84 million smallcells overall

- 81 million residential femto cells

- 123000 enterprise smallcells

- 120000 indoor urban smallcells

- 6980 outdoor urban smallcells and

- More than 2050 rural smallcells are deployed worldwide

현재는 대부분의 소형셀이 주거용 펨토셀로 구성되어 있으며 앞으로 다

양한 종류의 소형셀 수가 증가할 것으로 전망하고 있다 전 세계적으로 소형

셀을 도입하는 사업자수가 빠르게 증가하고 있어 앞으로 소형셀은 소형셀

기지국 역할 뿐만 아니라 가정에서 인터넷 서비스의 중심이 될 것으로 예상

된다 이렇게 나날이 증대되는 소형셀 신규 서비스들이 발생시킬 트래픽들은

코어망의 부담을 가중시킬 수 있다 따라서 소형셀 환경에서 코어망 트래픽

집중을 방지하기 위한 트래픽 오프로딩 방안으로 캐싱에 대한 연구가 필요

하다 특히 소형셀 특징에 적합하게 코어망의 부하를 줄이기 위한 캐싱 기법

은 필요성과 개략적인 시나리오만 제시될 뿐 아직 구체적인 방법과 표준이

나오지 않아 연구가 시급하다

본 논문에서는 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하

를 감소시키는 하나의 방안으로 소형셀 환경에 최적화된 새로운 local caching

알고리즘을 개발하고자 한다 본 논문의 구성은 다음과 같다 2장에서는 소형

셀 포럼의 연구 진행 상황을 파악하고 기존 웹 캐시 방식과 최근 제안되는

소형셀 캐시 알고리즘에 대해 분석한다 3장에서는 local caching 관점에서 소

형셀 사용자 특성을 적용한 네트워크 구조를 도출하고 이를 반영한 새로운

local caching 알고리즘을 제안하였다 4장에서는 시뮬레이션 환경을 설계하고

성능 분석 모델링을 통한 성능을 평가하고 5장에서 결론을 맺는다

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 6: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

iv

목 차

제 1 장 서론 1

제 2 장 관련 연구 4

제 1 절 소형셀 포럼 연구 진행 상황 4

제 2 절 기존 웹 캐시 기술 5

제 3 절 소형셀 캐시 기술 8

제 1 항 소형셀 캐시 저장 시나리오 8

제 2 절 소형셀 캐시 알고리즘 14

제 3 장 소형셀 LOCAL CACHING 알고리즘 제안 16

제 1 절 Local caching 관점에서 소형셀 특징 16

제 2 절 Local caching 을 위한 네트워크 구조 19

제 3 절 소형셀 최적화 된 Local caching 알고리즘 22

제 4 장 성능 분석 30

제 1 절 소형셀 Local caching 환경 설계 30

제 1 항 소형셀 사용자 설계 30

제 2 항 캐시 설계 32

제 2 절 소형셀 Cache efficiency 모델링 36

제 3 절 시뮬레이션을 이용한 검증 40

제 5 장 결론 50

참고 문헌 51

ABSTRACT 54

v

그림 목차

그림 1 소형셀 포럼 연구 진행상황 4

그림 2 국부적 소형셀 캐시 저장 시나리오 9

그림 3 기업적 소형셀 캐시 저장 시나리오 10

그림 4 분산적 소형셀 캐시 저장 시나리오 12

그림 5 Urban 지역 소형셀 캐시 저장 시나리오 13

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조 19

그림 7 캐시 업데이트 정책 순서도 25

그림 8 실제 적용 예시 27

그림 9 소형셀 local caching 알고리즘 의사코드 28

그림 10 웹 브라우저 별 시장 점유율 32

그림 11 소형셀 캐시 효용성 모델링 36

그림 12 트래픽 별 크기 비율(TS=1 KS=1) 41

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1) 42

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1) 43

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1) 44

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1) 45

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1) 46

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234) 47

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15) 48

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23) 49

vi

표 목차

표 1 기지국 분류 2

표 2 Squid 최다 방문 사이트 18

표 3 LTE 엔티티와 인터페이스 주요 기능 20

표 4 의사코드에 적용된 파라미터 29

표 5 100 위 내 키워드 검색 건수 31

표 6 웹 브라우저 별 캐시 사이즈 33

표 7 웹 서비스 별 파일 크기 34

표 8 실제 적용 예시 34

표 9 검색어 별 파일 크기 35

표 10 알고리즘 효용성 검증 변수 37

표 11 시뮬레이션 환경 40

vii

약 어 표

LTE Long Term Evolution

QoE Quality of Experience

HetNet Heterogeneous Network

CoMP Coordinated Multi-Point transmission and reception

eICIC Enhanced Inter Cell Interference Coordination

CA Carrier Aggregation

MIMO Multiple Input Multiple Output

CAPEX CAPital EXpenditures

OPEX OPerating EXpenditure

URL Uniform Resource Locator

POP Point Of Presence

SON Self Organizing Network

URL Uniform resource locator

LRU Least Recently Used

LFU Least Frequently Used

SLRU Size-adjusted Least Frequently Used

LFU Aging Least Frequently Used Aging

GD Greedy Dual

LUV Least Unified Value

CW Criteria Weighted

FIFO First In First Out

UPP User Preference Profile

AUS Active User Set

viii

MLR Most Likely Requested video

SARG Squid Analysis Report Generator

SC-GW SmallCell-Gate Way

EPC Evolved Packet Core

MME Mobility Management Model

HSS Home Subscriber Server

NAS Non Access Control

EPS Evolved Packet System

S-GW Serving-Gate Way

P-GW Packet data network-Gate Way

PCRF Policy Charging Resource Function

TS Traffic Scenario

KS Keyword Scenario

1

제 1 장 서론

LTE (Long Term Evolution) 서비스의 급속한 확산에 따라 이동전화 가입자

수는 꾸준히 증가하고 있다 2014년 9월 기준 국내 3사 이동통신사의 LTE 가

입자 수는 3천 4백만 명을 넘어섰다[1] 이동통신사들의 네트워크 망이 고도

화됨에 따라 실시간 스트리밍 고화질 동영상 재생 등 과거 속도와 용량의

한계로는 불가능했던 서비스의 소비가 증가하였다 그 결과 LTE 서비스 가

입자는 3G 가입자보다 3배 많은 데이터를 사용하고 있다[2] CISCO의 자료에

의하면 2013년도 전 세계 연 평균 발생하는 모바일 데이터 트래픽은

18Ebytes를 기록하였다 트래픽은 향후 꾸준히 증가하여 2018년도에는 11배

가 증가한 1908Ebytes에 달할 것으로 전망된다[3]

모바일 사용자의 트래픽 요구 사항과 사용 용량이 증가함에 따라 한정

된 주파수 자원으로 많은 용량을 처리하기 위한 다양한 기술 개발이 진행

중이다 5G 무선통신 네트워크에서는 현재 사용되고 있는 4G 무선통신 네트

워크보다 높은 통신 용량 사용자 측면에서 향상된 QoE (Quality of Experience)

성능 향상된 에너지 효율 등을 요구한다 이러한 요구사항을 만족시키기 위

해 HeNet (Heterogeneous network) CoMP (Coordinated Multi-Point transmission and

reception) eICIC (Enhanced Inter-Cell Interference Coordination) CA (Carrier

Aggregation) Massive MIMO (Multiple Input Multiple Output) 등 다양한 기술 논의

가 활발히 이루어지고 있다[4]

특히 코어망의 과부하를 방지하고 고품질의 서비스를 제공하기 위해

HetNet (Heterogeneous Network)에 대한 관심이 높아지면서 HetNet의 핵심 구성

요소로서 소형셀의 역할이 증대되고 있다 HetNet은 매크로셀로 운영되어 오

던 기존의 네트워크 문제를 해결하는 방법으로 매크로셀 내에 소형셀을 혼

용하는 방식을 채택하였다 매크로셀이 넓은 커버리지와 높은 전송파워를 갖

는 반면 소형셀은 좁은 커버리지와 낮은 전송파워를 갖는다[5]

2

표 1 기지국 분류

Table 1 Classification of base station

indoor outdoor

펨토셀 피코셀 펨토셀 피코셀 마이크로셀 매크로셀

전송파워 10mW

~100mW

100mW

~250mW 900mW~1W 1~5W 5~10W 10W 이상

커버리지 100~200m 250~500m 500~700m 05~15km 1~3km 1~25km

평균크기 5times8cm 10times10cm 20times20cm 20times30cm 40times30cm 50times60cm

무게 1kg 15kg 2~3kg 2~4kg 4~6kg 10~15kg

최대

사용자수 8~16 명 16~64 명 8~32 명 16~64 명 64~256 명 256 명 이상

구축장소 가정 가정기업 가로등 벽 가로등 벽 옥상전신주 타워마스트

일반적으로 표 1과 같이 안테나당 10W급 이하 기지국 장비나 피코셀

펨토셀 등을 통칭해 소형셀이라 한다[5] 소형셀은 매크로셀에 비해 기지국

크기가 작아 공간 대비 인구가 밀집된 장소에 설치가 용이하다 CAPEX

(CAPital EXpenditures) 측면에서는 초기 설치비가 적게 들고 단기간에 설치가

가능하며 OPEX (OPerating EXpenditure) 측면에서는 추가적인 비용이 들지 않

고 전력소모가 작아 유지 비용이 적게 소요되는 장점이 있다[6]

CISCO의 시장 전망 분석에 의하면 모바일 기기에서 와이파이 및

소형셀 네트워크를 통해 오프로딩되는 모바일 트래픽은 계속 급증할 것으로

전망하고 있으며 2018년이 되면 모바일 네트워크 상에서 생성되는 트래픽을

능가할 것으로 예상하고 있다[3] 앞으로 소형셀은 매크로 셀을 보완하여 추

가적인 용량을 제공하는 기존 개념에서 발전하여 가정과 사무실에 독자적으

로 용량을 제공하여 모바일 네트워크의 핵심 요소로 자리매김 할 것으로 예

상된다 소형셀 포럼에서 발표한 2014년 3월 31일 기준 전세계 소형셀 배치

현황은 다음과 같다[7]

3

- 84 million smallcells overall

- 81 million residential femto cells

- 123000 enterprise smallcells

- 120000 indoor urban smallcells

- 6980 outdoor urban smallcells and

- More than 2050 rural smallcells are deployed worldwide

현재는 대부분의 소형셀이 주거용 펨토셀로 구성되어 있으며 앞으로 다

양한 종류의 소형셀 수가 증가할 것으로 전망하고 있다 전 세계적으로 소형

셀을 도입하는 사업자수가 빠르게 증가하고 있어 앞으로 소형셀은 소형셀

기지국 역할 뿐만 아니라 가정에서 인터넷 서비스의 중심이 될 것으로 예상

된다 이렇게 나날이 증대되는 소형셀 신규 서비스들이 발생시킬 트래픽들은

코어망의 부담을 가중시킬 수 있다 따라서 소형셀 환경에서 코어망 트래픽

집중을 방지하기 위한 트래픽 오프로딩 방안으로 캐싱에 대한 연구가 필요

하다 특히 소형셀 특징에 적합하게 코어망의 부하를 줄이기 위한 캐싱 기법

은 필요성과 개략적인 시나리오만 제시될 뿐 아직 구체적인 방법과 표준이

나오지 않아 연구가 시급하다

본 논문에서는 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하

를 감소시키는 하나의 방안으로 소형셀 환경에 최적화된 새로운 local caching

알고리즘을 개발하고자 한다 본 논문의 구성은 다음과 같다 2장에서는 소형

셀 포럼의 연구 진행 상황을 파악하고 기존 웹 캐시 방식과 최근 제안되는

소형셀 캐시 알고리즘에 대해 분석한다 3장에서는 local caching 관점에서 소

형셀 사용자 특성을 적용한 네트워크 구조를 도출하고 이를 반영한 새로운

local caching 알고리즘을 제안하였다 4장에서는 시뮬레이션 환경을 설계하고

성능 분석 모델링을 통한 성능을 평가하고 5장에서 결론을 맺는다

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 7: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

v

그림 목차

그림 1 소형셀 포럼 연구 진행상황 4

그림 2 국부적 소형셀 캐시 저장 시나리오 9

그림 3 기업적 소형셀 캐시 저장 시나리오 10

그림 4 분산적 소형셀 캐시 저장 시나리오 12

그림 5 Urban 지역 소형셀 캐시 저장 시나리오 13

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조 19

그림 7 캐시 업데이트 정책 순서도 25

그림 8 실제 적용 예시 27

그림 9 소형셀 local caching 알고리즘 의사코드 28

그림 10 웹 브라우저 별 시장 점유율 32

그림 11 소형셀 캐시 효용성 모델링 36

그림 12 트래픽 별 크기 비율(TS=1 KS=1) 41

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1) 42

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1) 43

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1) 44

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1) 45

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1) 46

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234) 47

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15) 48

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23) 49

vi

표 목차

표 1 기지국 분류 2

표 2 Squid 최다 방문 사이트 18

표 3 LTE 엔티티와 인터페이스 주요 기능 20

표 4 의사코드에 적용된 파라미터 29

표 5 100 위 내 키워드 검색 건수 31

표 6 웹 브라우저 별 캐시 사이즈 33

표 7 웹 서비스 별 파일 크기 34

표 8 실제 적용 예시 34

표 9 검색어 별 파일 크기 35

표 10 알고리즘 효용성 검증 변수 37

표 11 시뮬레이션 환경 40

vii

약 어 표

LTE Long Term Evolution

QoE Quality of Experience

HetNet Heterogeneous Network

CoMP Coordinated Multi-Point transmission and reception

eICIC Enhanced Inter Cell Interference Coordination

CA Carrier Aggregation

MIMO Multiple Input Multiple Output

CAPEX CAPital EXpenditures

OPEX OPerating EXpenditure

URL Uniform Resource Locator

POP Point Of Presence

SON Self Organizing Network

URL Uniform resource locator

LRU Least Recently Used

LFU Least Frequently Used

SLRU Size-adjusted Least Frequently Used

LFU Aging Least Frequently Used Aging

GD Greedy Dual

LUV Least Unified Value

CW Criteria Weighted

FIFO First In First Out

UPP User Preference Profile

AUS Active User Set

viii

MLR Most Likely Requested video

SARG Squid Analysis Report Generator

SC-GW SmallCell-Gate Way

EPC Evolved Packet Core

MME Mobility Management Model

HSS Home Subscriber Server

NAS Non Access Control

EPS Evolved Packet System

S-GW Serving-Gate Way

P-GW Packet data network-Gate Way

PCRF Policy Charging Resource Function

TS Traffic Scenario

KS Keyword Scenario

1

제 1 장 서론

LTE (Long Term Evolution) 서비스의 급속한 확산에 따라 이동전화 가입자

수는 꾸준히 증가하고 있다 2014년 9월 기준 국내 3사 이동통신사의 LTE 가

입자 수는 3천 4백만 명을 넘어섰다[1] 이동통신사들의 네트워크 망이 고도

화됨에 따라 실시간 스트리밍 고화질 동영상 재생 등 과거 속도와 용량의

한계로는 불가능했던 서비스의 소비가 증가하였다 그 결과 LTE 서비스 가

입자는 3G 가입자보다 3배 많은 데이터를 사용하고 있다[2] CISCO의 자료에

의하면 2013년도 전 세계 연 평균 발생하는 모바일 데이터 트래픽은

18Ebytes를 기록하였다 트래픽은 향후 꾸준히 증가하여 2018년도에는 11배

가 증가한 1908Ebytes에 달할 것으로 전망된다[3]

모바일 사용자의 트래픽 요구 사항과 사용 용량이 증가함에 따라 한정

된 주파수 자원으로 많은 용량을 처리하기 위한 다양한 기술 개발이 진행

중이다 5G 무선통신 네트워크에서는 현재 사용되고 있는 4G 무선통신 네트

워크보다 높은 통신 용량 사용자 측면에서 향상된 QoE (Quality of Experience)

성능 향상된 에너지 효율 등을 요구한다 이러한 요구사항을 만족시키기 위

해 HeNet (Heterogeneous network) CoMP (Coordinated Multi-Point transmission and

reception) eICIC (Enhanced Inter-Cell Interference Coordination) CA (Carrier

Aggregation) Massive MIMO (Multiple Input Multiple Output) 등 다양한 기술 논의

가 활발히 이루어지고 있다[4]

특히 코어망의 과부하를 방지하고 고품질의 서비스를 제공하기 위해

HetNet (Heterogeneous Network)에 대한 관심이 높아지면서 HetNet의 핵심 구성

요소로서 소형셀의 역할이 증대되고 있다 HetNet은 매크로셀로 운영되어 오

던 기존의 네트워크 문제를 해결하는 방법으로 매크로셀 내에 소형셀을 혼

용하는 방식을 채택하였다 매크로셀이 넓은 커버리지와 높은 전송파워를 갖

는 반면 소형셀은 좁은 커버리지와 낮은 전송파워를 갖는다[5]

2

표 1 기지국 분류

Table 1 Classification of base station

indoor outdoor

펨토셀 피코셀 펨토셀 피코셀 마이크로셀 매크로셀

전송파워 10mW

~100mW

100mW

~250mW 900mW~1W 1~5W 5~10W 10W 이상

커버리지 100~200m 250~500m 500~700m 05~15km 1~3km 1~25km

평균크기 5times8cm 10times10cm 20times20cm 20times30cm 40times30cm 50times60cm

무게 1kg 15kg 2~3kg 2~4kg 4~6kg 10~15kg

최대

사용자수 8~16 명 16~64 명 8~32 명 16~64 명 64~256 명 256 명 이상

구축장소 가정 가정기업 가로등 벽 가로등 벽 옥상전신주 타워마스트

일반적으로 표 1과 같이 안테나당 10W급 이하 기지국 장비나 피코셀

펨토셀 등을 통칭해 소형셀이라 한다[5] 소형셀은 매크로셀에 비해 기지국

크기가 작아 공간 대비 인구가 밀집된 장소에 설치가 용이하다 CAPEX

(CAPital EXpenditures) 측면에서는 초기 설치비가 적게 들고 단기간에 설치가

가능하며 OPEX (OPerating EXpenditure) 측면에서는 추가적인 비용이 들지 않

고 전력소모가 작아 유지 비용이 적게 소요되는 장점이 있다[6]

CISCO의 시장 전망 분석에 의하면 모바일 기기에서 와이파이 및

소형셀 네트워크를 통해 오프로딩되는 모바일 트래픽은 계속 급증할 것으로

전망하고 있으며 2018년이 되면 모바일 네트워크 상에서 생성되는 트래픽을

능가할 것으로 예상하고 있다[3] 앞으로 소형셀은 매크로 셀을 보완하여 추

가적인 용량을 제공하는 기존 개념에서 발전하여 가정과 사무실에 독자적으

로 용량을 제공하여 모바일 네트워크의 핵심 요소로 자리매김 할 것으로 예

상된다 소형셀 포럼에서 발표한 2014년 3월 31일 기준 전세계 소형셀 배치

현황은 다음과 같다[7]

3

- 84 million smallcells overall

- 81 million residential femto cells

- 123000 enterprise smallcells

- 120000 indoor urban smallcells

- 6980 outdoor urban smallcells and

- More than 2050 rural smallcells are deployed worldwide

현재는 대부분의 소형셀이 주거용 펨토셀로 구성되어 있으며 앞으로 다

양한 종류의 소형셀 수가 증가할 것으로 전망하고 있다 전 세계적으로 소형

셀을 도입하는 사업자수가 빠르게 증가하고 있어 앞으로 소형셀은 소형셀

기지국 역할 뿐만 아니라 가정에서 인터넷 서비스의 중심이 될 것으로 예상

된다 이렇게 나날이 증대되는 소형셀 신규 서비스들이 발생시킬 트래픽들은

코어망의 부담을 가중시킬 수 있다 따라서 소형셀 환경에서 코어망 트래픽

집중을 방지하기 위한 트래픽 오프로딩 방안으로 캐싱에 대한 연구가 필요

하다 특히 소형셀 특징에 적합하게 코어망의 부하를 줄이기 위한 캐싱 기법

은 필요성과 개략적인 시나리오만 제시될 뿐 아직 구체적인 방법과 표준이

나오지 않아 연구가 시급하다

본 논문에서는 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하

를 감소시키는 하나의 방안으로 소형셀 환경에 최적화된 새로운 local caching

알고리즘을 개발하고자 한다 본 논문의 구성은 다음과 같다 2장에서는 소형

셀 포럼의 연구 진행 상황을 파악하고 기존 웹 캐시 방식과 최근 제안되는

소형셀 캐시 알고리즘에 대해 분석한다 3장에서는 local caching 관점에서 소

형셀 사용자 특성을 적용한 네트워크 구조를 도출하고 이를 반영한 새로운

local caching 알고리즘을 제안하였다 4장에서는 시뮬레이션 환경을 설계하고

성능 분석 모델링을 통한 성능을 평가하고 5장에서 결론을 맺는다

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 8: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

vi

표 목차

표 1 기지국 분류 2

표 2 Squid 최다 방문 사이트 18

표 3 LTE 엔티티와 인터페이스 주요 기능 20

표 4 의사코드에 적용된 파라미터 29

표 5 100 위 내 키워드 검색 건수 31

표 6 웹 브라우저 별 캐시 사이즈 33

표 7 웹 서비스 별 파일 크기 34

표 8 실제 적용 예시 34

표 9 검색어 별 파일 크기 35

표 10 알고리즘 효용성 검증 변수 37

표 11 시뮬레이션 환경 40

vii

약 어 표

LTE Long Term Evolution

QoE Quality of Experience

HetNet Heterogeneous Network

CoMP Coordinated Multi-Point transmission and reception

eICIC Enhanced Inter Cell Interference Coordination

CA Carrier Aggregation

MIMO Multiple Input Multiple Output

CAPEX CAPital EXpenditures

OPEX OPerating EXpenditure

URL Uniform Resource Locator

POP Point Of Presence

SON Self Organizing Network

URL Uniform resource locator

LRU Least Recently Used

LFU Least Frequently Used

SLRU Size-adjusted Least Frequently Used

LFU Aging Least Frequently Used Aging

GD Greedy Dual

LUV Least Unified Value

CW Criteria Weighted

FIFO First In First Out

UPP User Preference Profile

AUS Active User Set

viii

MLR Most Likely Requested video

SARG Squid Analysis Report Generator

SC-GW SmallCell-Gate Way

EPC Evolved Packet Core

MME Mobility Management Model

HSS Home Subscriber Server

NAS Non Access Control

EPS Evolved Packet System

S-GW Serving-Gate Way

P-GW Packet data network-Gate Way

PCRF Policy Charging Resource Function

TS Traffic Scenario

KS Keyword Scenario

1

제 1 장 서론

LTE (Long Term Evolution) 서비스의 급속한 확산에 따라 이동전화 가입자

수는 꾸준히 증가하고 있다 2014년 9월 기준 국내 3사 이동통신사의 LTE 가

입자 수는 3천 4백만 명을 넘어섰다[1] 이동통신사들의 네트워크 망이 고도

화됨에 따라 실시간 스트리밍 고화질 동영상 재생 등 과거 속도와 용량의

한계로는 불가능했던 서비스의 소비가 증가하였다 그 결과 LTE 서비스 가

입자는 3G 가입자보다 3배 많은 데이터를 사용하고 있다[2] CISCO의 자료에

의하면 2013년도 전 세계 연 평균 발생하는 모바일 데이터 트래픽은

18Ebytes를 기록하였다 트래픽은 향후 꾸준히 증가하여 2018년도에는 11배

가 증가한 1908Ebytes에 달할 것으로 전망된다[3]

모바일 사용자의 트래픽 요구 사항과 사용 용량이 증가함에 따라 한정

된 주파수 자원으로 많은 용량을 처리하기 위한 다양한 기술 개발이 진행

중이다 5G 무선통신 네트워크에서는 현재 사용되고 있는 4G 무선통신 네트

워크보다 높은 통신 용량 사용자 측면에서 향상된 QoE (Quality of Experience)

성능 향상된 에너지 효율 등을 요구한다 이러한 요구사항을 만족시키기 위

해 HeNet (Heterogeneous network) CoMP (Coordinated Multi-Point transmission and

reception) eICIC (Enhanced Inter-Cell Interference Coordination) CA (Carrier

Aggregation) Massive MIMO (Multiple Input Multiple Output) 등 다양한 기술 논의

가 활발히 이루어지고 있다[4]

특히 코어망의 과부하를 방지하고 고품질의 서비스를 제공하기 위해

HetNet (Heterogeneous Network)에 대한 관심이 높아지면서 HetNet의 핵심 구성

요소로서 소형셀의 역할이 증대되고 있다 HetNet은 매크로셀로 운영되어 오

던 기존의 네트워크 문제를 해결하는 방법으로 매크로셀 내에 소형셀을 혼

용하는 방식을 채택하였다 매크로셀이 넓은 커버리지와 높은 전송파워를 갖

는 반면 소형셀은 좁은 커버리지와 낮은 전송파워를 갖는다[5]

2

표 1 기지국 분류

Table 1 Classification of base station

indoor outdoor

펨토셀 피코셀 펨토셀 피코셀 마이크로셀 매크로셀

전송파워 10mW

~100mW

100mW

~250mW 900mW~1W 1~5W 5~10W 10W 이상

커버리지 100~200m 250~500m 500~700m 05~15km 1~3km 1~25km

평균크기 5times8cm 10times10cm 20times20cm 20times30cm 40times30cm 50times60cm

무게 1kg 15kg 2~3kg 2~4kg 4~6kg 10~15kg

최대

사용자수 8~16 명 16~64 명 8~32 명 16~64 명 64~256 명 256 명 이상

구축장소 가정 가정기업 가로등 벽 가로등 벽 옥상전신주 타워마스트

일반적으로 표 1과 같이 안테나당 10W급 이하 기지국 장비나 피코셀

펨토셀 등을 통칭해 소형셀이라 한다[5] 소형셀은 매크로셀에 비해 기지국

크기가 작아 공간 대비 인구가 밀집된 장소에 설치가 용이하다 CAPEX

(CAPital EXpenditures) 측면에서는 초기 설치비가 적게 들고 단기간에 설치가

가능하며 OPEX (OPerating EXpenditure) 측면에서는 추가적인 비용이 들지 않

고 전력소모가 작아 유지 비용이 적게 소요되는 장점이 있다[6]

CISCO의 시장 전망 분석에 의하면 모바일 기기에서 와이파이 및

소형셀 네트워크를 통해 오프로딩되는 모바일 트래픽은 계속 급증할 것으로

전망하고 있으며 2018년이 되면 모바일 네트워크 상에서 생성되는 트래픽을

능가할 것으로 예상하고 있다[3] 앞으로 소형셀은 매크로 셀을 보완하여 추

가적인 용량을 제공하는 기존 개념에서 발전하여 가정과 사무실에 독자적으

로 용량을 제공하여 모바일 네트워크의 핵심 요소로 자리매김 할 것으로 예

상된다 소형셀 포럼에서 발표한 2014년 3월 31일 기준 전세계 소형셀 배치

현황은 다음과 같다[7]

3

- 84 million smallcells overall

- 81 million residential femto cells

- 123000 enterprise smallcells

- 120000 indoor urban smallcells

- 6980 outdoor urban smallcells and

- More than 2050 rural smallcells are deployed worldwide

현재는 대부분의 소형셀이 주거용 펨토셀로 구성되어 있으며 앞으로 다

양한 종류의 소형셀 수가 증가할 것으로 전망하고 있다 전 세계적으로 소형

셀을 도입하는 사업자수가 빠르게 증가하고 있어 앞으로 소형셀은 소형셀

기지국 역할 뿐만 아니라 가정에서 인터넷 서비스의 중심이 될 것으로 예상

된다 이렇게 나날이 증대되는 소형셀 신규 서비스들이 발생시킬 트래픽들은

코어망의 부담을 가중시킬 수 있다 따라서 소형셀 환경에서 코어망 트래픽

집중을 방지하기 위한 트래픽 오프로딩 방안으로 캐싱에 대한 연구가 필요

하다 특히 소형셀 특징에 적합하게 코어망의 부하를 줄이기 위한 캐싱 기법

은 필요성과 개략적인 시나리오만 제시될 뿐 아직 구체적인 방법과 표준이

나오지 않아 연구가 시급하다

본 논문에서는 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하

를 감소시키는 하나의 방안으로 소형셀 환경에 최적화된 새로운 local caching

알고리즘을 개발하고자 한다 본 논문의 구성은 다음과 같다 2장에서는 소형

셀 포럼의 연구 진행 상황을 파악하고 기존 웹 캐시 방식과 최근 제안되는

소형셀 캐시 알고리즘에 대해 분석한다 3장에서는 local caching 관점에서 소

형셀 사용자 특성을 적용한 네트워크 구조를 도출하고 이를 반영한 새로운

local caching 알고리즘을 제안하였다 4장에서는 시뮬레이션 환경을 설계하고

성능 분석 모델링을 통한 성능을 평가하고 5장에서 결론을 맺는다

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 9: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

vii

약 어 표

LTE Long Term Evolution

QoE Quality of Experience

HetNet Heterogeneous Network

CoMP Coordinated Multi-Point transmission and reception

eICIC Enhanced Inter Cell Interference Coordination

CA Carrier Aggregation

MIMO Multiple Input Multiple Output

CAPEX CAPital EXpenditures

OPEX OPerating EXpenditure

URL Uniform Resource Locator

POP Point Of Presence

SON Self Organizing Network

URL Uniform resource locator

LRU Least Recently Used

LFU Least Frequently Used

SLRU Size-adjusted Least Frequently Used

LFU Aging Least Frequently Used Aging

GD Greedy Dual

LUV Least Unified Value

CW Criteria Weighted

FIFO First In First Out

UPP User Preference Profile

AUS Active User Set

viii

MLR Most Likely Requested video

SARG Squid Analysis Report Generator

SC-GW SmallCell-Gate Way

EPC Evolved Packet Core

MME Mobility Management Model

HSS Home Subscriber Server

NAS Non Access Control

EPS Evolved Packet System

S-GW Serving-Gate Way

P-GW Packet data network-Gate Way

PCRF Policy Charging Resource Function

TS Traffic Scenario

KS Keyword Scenario

1

제 1 장 서론

LTE (Long Term Evolution) 서비스의 급속한 확산에 따라 이동전화 가입자

수는 꾸준히 증가하고 있다 2014년 9월 기준 국내 3사 이동통신사의 LTE 가

입자 수는 3천 4백만 명을 넘어섰다[1] 이동통신사들의 네트워크 망이 고도

화됨에 따라 실시간 스트리밍 고화질 동영상 재생 등 과거 속도와 용량의

한계로는 불가능했던 서비스의 소비가 증가하였다 그 결과 LTE 서비스 가

입자는 3G 가입자보다 3배 많은 데이터를 사용하고 있다[2] CISCO의 자료에

의하면 2013년도 전 세계 연 평균 발생하는 모바일 데이터 트래픽은

18Ebytes를 기록하였다 트래픽은 향후 꾸준히 증가하여 2018년도에는 11배

가 증가한 1908Ebytes에 달할 것으로 전망된다[3]

모바일 사용자의 트래픽 요구 사항과 사용 용량이 증가함에 따라 한정

된 주파수 자원으로 많은 용량을 처리하기 위한 다양한 기술 개발이 진행

중이다 5G 무선통신 네트워크에서는 현재 사용되고 있는 4G 무선통신 네트

워크보다 높은 통신 용량 사용자 측면에서 향상된 QoE (Quality of Experience)

성능 향상된 에너지 효율 등을 요구한다 이러한 요구사항을 만족시키기 위

해 HeNet (Heterogeneous network) CoMP (Coordinated Multi-Point transmission and

reception) eICIC (Enhanced Inter-Cell Interference Coordination) CA (Carrier

Aggregation) Massive MIMO (Multiple Input Multiple Output) 등 다양한 기술 논의

가 활발히 이루어지고 있다[4]

특히 코어망의 과부하를 방지하고 고품질의 서비스를 제공하기 위해

HetNet (Heterogeneous Network)에 대한 관심이 높아지면서 HetNet의 핵심 구성

요소로서 소형셀의 역할이 증대되고 있다 HetNet은 매크로셀로 운영되어 오

던 기존의 네트워크 문제를 해결하는 방법으로 매크로셀 내에 소형셀을 혼

용하는 방식을 채택하였다 매크로셀이 넓은 커버리지와 높은 전송파워를 갖

는 반면 소형셀은 좁은 커버리지와 낮은 전송파워를 갖는다[5]

2

표 1 기지국 분류

Table 1 Classification of base station

indoor outdoor

펨토셀 피코셀 펨토셀 피코셀 마이크로셀 매크로셀

전송파워 10mW

~100mW

100mW

~250mW 900mW~1W 1~5W 5~10W 10W 이상

커버리지 100~200m 250~500m 500~700m 05~15km 1~3km 1~25km

평균크기 5times8cm 10times10cm 20times20cm 20times30cm 40times30cm 50times60cm

무게 1kg 15kg 2~3kg 2~4kg 4~6kg 10~15kg

최대

사용자수 8~16 명 16~64 명 8~32 명 16~64 명 64~256 명 256 명 이상

구축장소 가정 가정기업 가로등 벽 가로등 벽 옥상전신주 타워마스트

일반적으로 표 1과 같이 안테나당 10W급 이하 기지국 장비나 피코셀

펨토셀 등을 통칭해 소형셀이라 한다[5] 소형셀은 매크로셀에 비해 기지국

크기가 작아 공간 대비 인구가 밀집된 장소에 설치가 용이하다 CAPEX

(CAPital EXpenditures) 측면에서는 초기 설치비가 적게 들고 단기간에 설치가

가능하며 OPEX (OPerating EXpenditure) 측면에서는 추가적인 비용이 들지 않

고 전력소모가 작아 유지 비용이 적게 소요되는 장점이 있다[6]

CISCO의 시장 전망 분석에 의하면 모바일 기기에서 와이파이 및

소형셀 네트워크를 통해 오프로딩되는 모바일 트래픽은 계속 급증할 것으로

전망하고 있으며 2018년이 되면 모바일 네트워크 상에서 생성되는 트래픽을

능가할 것으로 예상하고 있다[3] 앞으로 소형셀은 매크로 셀을 보완하여 추

가적인 용량을 제공하는 기존 개념에서 발전하여 가정과 사무실에 독자적으

로 용량을 제공하여 모바일 네트워크의 핵심 요소로 자리매김 할 것으로 예

상된다 소형셀 포럼에서 발표한 2014년 3월 31일 기준 전세계 소형셀 배치

현황은 다음과 같다[7]

3

- 84 million smallcells overall

- 81 million residential femto cells

- 123000 enterprise smallcells

- 120000 indoor urban smallcells

- 6980 outdoor urban smallcells and

- More than 2050 rural smallcells are deployed worldwide

현재는 대부분의 소형셀이 주거용 펨토셀로 구성되어 있으며 앞으로 다

양한 종류의 소형셀 수가 증가할 것으로 전망하고 있다 전 세계적으로 소형

셀을 도입하는 사업자수가 빠르게 증가하고 있어 앞으로 소형셀은 소형셀

기지국 역할 뿐만 아니라 가정에서 인터넷 서비스의 중심이 될 것으로 예상

된다 이렇게 나날이 증대되는 소형셀 신규 서비스들이 발생시킬 트래픽들은

코어망의 부담을 가중시킬 수 있다 따라서 소형셀 환경에서 코어망 트래픽

집중을 방지하기 위한 트래픽 오프로딩 방안으로 캐싱에 대한 연구가 필요

하다 특히 소형셀 특징에 적합하게 코어망의 부하를 줄이기 위한 캐싱 기법

은 필요성과 개략적인 시나리오만 제시될 뿐 아직 구체적인 방법과 표준이

나오지 않아 연구가 시급하다

본 논문에서는 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하

를 감소시키는 하나의 방안으로 소형셀 환경에 최적화된 새로운 local caching

알고리즘을 개발하고자 한다 본 논문의 구성은 다음과 같다 2장에서는 소형

셀 포럼의 연구 진행 상황을 파악하고 기존 웹 캐시 방식과 최근 제안되는

소형셀 캐시 알고리즘에 대해 분석한다 3장에서는 local caching 관점에서 소

형셀 사용자 특성을 적용한 네트워크 구조를 도출하고 이를 반영한 새로운

local caching 알고리즘을 제안하였다 4장에서는 시뮬레이션 환경을 설계하고

성능 분석 모델링을 통한 성능을 평가하고 5장에서 결론을 맺는다

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 10: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

viii

MLR Most Likely Requested video

SARG Squid Analysis Report Generator

SC-GW SmallCell-Gate Way

EPC Evolved Packet Core

MME Mobility Management Model

HSS Home Subscriber Server

NAS Non Access Control

EPS Evolved Packet System

S-GW Serving-Gate Way

P-GW Packet data network-Gate Way

PCRF Policy Charging Resource Function

TS Traffic Scenario

KS Keyword Scenario

1

제 1 장 서론

LTE (Long Term Evolution) 서비스의 급속한 확산에 따라 이동전화 가입자

수는 꾸준히 증가하고 있다 2014년 9월 기준 국내 3사 이동통신사의 LTE 가

입자 수는 3천 4백만 명을 넘어섰다[1] 이동통신사들의 네트워크 망이 고도

화됨에 따라 실시간 스트리밍 고화질 동영상 재생 등 과거 속도와 용량의

한계로는 불가능했던 서비스의 소비가 증가하였다 그 결과 LTE 서비스 가

입자는 3G 가입자보다 3배 많은 데이터를 사용하고 있다[2] CISCO의 자료에

의하면 2013년도 전 세계 연 평균 발생하는 모바일 데이터 트래픽은

18Ebytes를 기록하였다 트래픽은 향후 꾸준히 증가하여 2018년도에는 11배

가 증가한 1908Ebytes에 달할 것으로 전망된다[3]

모바일 사용자의 트래픽 요구 사항과 사용 용량이 증가함에 따라 한정

된 주파수 자원으로 많은 용량을 처리하기 위한 다양한 기술 개발이 진행

중이다 5G 무선통신 네트워크에서는 현재 사용되고 있는 4G 무선통신 네트

워크보다 높은 통신 용량 사용자 측면에서 향상된 QoE (Quality of Experience)

성능 향상된 에너지 효율 등을 요구한다 이러한 요구사항을 만족시키기 위

해 HeNet (Heterogeneous network) CoMP (Coordinated Multi-Point transmission and

reception) eICIC (Enhanced Inter-Cell Interference Coordination) CA (Carrier

Aggregation) Massive MIMO (Multiple Input Multiple Output) 등 다양한 기술 논의

가 활발히 이루어지고 있다[4]

특히 코어망의 과부하를 방지하고 고품질의 서비스를 제공하기 위해

HetNet (Heterogeneous Network)에 대한 관심이 높아지면서 HetNet의 핵심 구성

요소로서 소형셀의 역할이 증대되고 있다 HetNet은 매크로셀로 운영되어 오

던 기존의 네트워크 문제를 해결하는 방법으로 매크로셀 내에 소형셀을 혼

용하는 방식을 채택하였다 매크로셀이 넓은 커버리지와 높은 전송파워를 갖

는 반면 소형셀은 좁은 커버리지와 낮은 전송파워를 갖는다[5]

2

표 1 기지국 분류

Table 1 Classification of base station

indoor outdoor

펨토셀 피코셀 펨토셀 피코셀 마이크로셀 매크로셀

전송파워 10mW

~100mW

100mW

~250mW 900mW~1W 1~5W 5~10W 10W 이상

커버리지 100~200m 250~500m 500~700m 05~15km 1~3km 1~25km

평균크기 5times8cm 10times10cm 20times20cm 20times30cm 40times30cm 50times60cm

무게 1kg 15kg 2~3kg 2~4kg 4~6kg 10~15kg

최대

사용자수 8~16 명 16~64 명 8~32 명 16~64 명 64~256 명 256 명 이상

구축장소 가정 가정기업 가로등 벽 가로등 벽 옥상전신주 타워마스트

일반적으로 표 1과 같이 안테나당 10W급 이하 기지국 장비나 피코셀

펨토셀 등을 통칭해 소형셀이라 한다[5] 소형셀은 매크로셀에 비해 기지국

크기가 작아 공간 대비 인구가 밀집된 장소에 설치가 용이하다 CAPEX

(CAPital EXpenditures) 측면에서는 초기 설치비가 적게 들고 단기간에 설치가

가능하며 OPEX (OPerating EXpenditure) 측면에서는 추가적인 비용이 들지 않

고 전력소모가 작아 유지 비용이 적게 소요되는 장점이 있다[6]

CISCO의 시장 전망 분석에 의하면 모바일 기기에서 와이파이 및

소형셀 네트워크를 통해 오프로딩되는 모바일 트래픽은 계속 급증할 것으로

전망하고 있으며 2018년이 되면 모바일 네트워크 상에서 생성되는 트래픽을

능가할 것으로 예상하고 있다[3] 앞으로 소형셀은 매크로 셀을 보완하여 추

가적인 용량을 제공하는 기존 개념에서 발전하여 가정과 사무실에 독자적으

로 용량을 제공하여 모바일 네트워크의 핵심 요소로 자리매김 할 것으로 예

상된다 소형셀 포럼에서 발표한 2014년 3월 31일 기준 전세계 소형셀 배치

현황은 다음과 같다[7]

3

- 84 million smallcells overall

- 81 million residential femto cells

- 123000 enterprise smallcells

- 120000 indoor urban smallcells

- 6980 outdoor urban smallcells and

- More than 2050 rural smallcells are deployed worldwide

현재는 대부분의 소형셀이 주거용 펨토셀로 구성되어 있으며 앞으로 다

양한 종류의 소형셀 수가 증가할 것으로 전망하고 있다 전 세계적으로 소형

셀을 도입하는 사업자수가 빠르게 증가하고 있어 앞으로 소형셀은 소형셀

기지국 역할 뿐만 아니라 가정에서 인터넷 서비스의 중심이 될 것으로 예상

된다 이렇게 나날이 증대되는 소형셀 신규 서비스들이 발생시킬 트래픽들은

코어망의 부담을 가중시킬 수 있다 따라서 소형셀 환경에서 코어망 트래픽

집중을 방지하기 위한 트래픽 오프로딩 방안으로 캐싱에 대한 연구가 필요

하다 특히 소형셀 특징에 적합하게 코어망의 부하를 줄이기 위한 캐싱 기법

은 필요성과 개략적인 시나리오만 제시될 뿐 아직 구체적인 방법과 표준이

나오지 않아 연구가 시급하다

본 논문에서는 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하

를 감소시키는 하나의 방안으로 소형셀 환경에 최적화된 새로운 local caching

알고리즘을 개발하고자 한다 본 논문의 구성은 다음과 같다 2장에서는 소형

셀 포럼의 연구 진행 상황을 파악하고 기존 웹 캐시 방식과 최근 제안되는

소형셀 캐시 알고리즘에 대해 분석한다 3장에서는 local caching 관점에서 소

형셀 사용자 특성을 적용한 네트워크 구조를 도출하고 이를 반영한 새로운

local caching 알고리즘을 제안하였다 4장에서는 시뮬레이션 환경을 설계하고

성능 분석 모델링을 통한 성능을 평가하고 5장에서 결론을 맺는다

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 11: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

1

제 1 장 서론

LTE (Long Term Evolution) 서비스의 급속한 확산에 따라 이동전화 가입자

수는 꾸준히 증가하고 있다 2014년 9월 기준 국내 3사 이동통신사의 LTE 가

입자 수는 3천 4백만 명을 넘어섰다[1] 이동통신사들의 네트워크 망이 고도

화됨에 따라 실시간 스트리밍 고화질 동영상 재생 등 과거 속도와 용량의

한계로는 불가능했던 서비스의 소비가 증가하였다 그 결과 LTE 서비스 가

입자는 3G 가입자보다 3배 많은 데이터를 사용하고 있다[2] CISCO의 자료에

의하면 2013년도 전 세계 연 평균 발생하는 모바일 데이터 트래픽은

18Ebytes를 기록하였다 트래픽은 향후 꾸준히 증가하여 2018년도에는 11배

가 증가한 1908Ebytes에 달할 것으로 전망된다[3]

모바일 사용자의 트래픽 요구 사항과 사용 용량이 증가함에 따라 한정

된 주파수 자원으로 많은 용량을 처리하기 위한 다양한 기술 개발이 진행

중이다 5G 무선통신 네트워크에서는 현재 사용되고 있는 4G 무선통신 네트

워크보다 높은 통신 용량 사용자 측면에서 향상된 QoE (Quality of Experience)

성능 향상된 에너지 효율 등을 요구한다 이러한 요구사항을 만족시키기 위

해 HeNet (Heterogeneous network) CoMP (Coordinated Multi-Point transmission and

reception) eICIC (Enhanced Inter-Cell Interference Coordination) CA (Carrier

Aggregation) Massive MIMO (Multiple Input Multiple Output) 등 다양한 기술 논의

가 활발히 이루어지고 있다[4]

특히 코어망의 과부하를 방지하고 고품질의 서비스를 제공하기 위해

HetNet (Heterogeneous Network)에 대한 관심이 높아지면서 HetNet의 핵심 구성

요소로서 소형셀의 역할이 증대되고 있다 HetNet은 매크로셀로 운영되어 오

던 기존의 네트워크 문제를 해결하는 방법으로 매크로셀 내에 소형셀을 혼

용하는 방식을 채택하였다 매크로셀이 넓은 커버리지와 높은 전송파워를 갖

는 반면 소형셀은 좁은 커버리지와 낮은 전송파워를 갖는다[5]

2

표 1 기지국 분류

Table 1 Classification of base station

indoor outdoor

펨토셀 피코셀 펨토셀 피코셀 마이크로셀 매크로셀

전송파워 10mW

~100mW

100mW

~250mW 900mW~1W 1~5W 5~10W 10W 이상

커버리지 100~200m 250~500m 500~700m 05~15km 1~3km 1~25km

평균크기 5times8cm 10times10cm 20times20cm 20times30cm 40times30cm 50times60cm

무게 1kg 15kg 2~3kg 2~4kg 4~6kg 10~15kg

최대

사용자수 8~16 명 16~64 명 8~32 명 16~64 명 64~256 명 256 명 이상

구축장소 가정 가정기업 가로등 벽 가로등 벽 옥상전신주 타워마스트

일반적으로 표 1과 같이 안테나당 10W급 이하 기지국 장비나 피코셀

펨토셀 등을 통칭해 소형셀이라 한다[5] 소형셀은 매크로셀에 비해 기지국

크기가 작아 공간 대비 인구가 밀집된 장소에 설치가 용이하다 CAPEX

(CAPital EXpenditures) 측면에서는 초기 설치비가 적게 들고 단기간에 설치가

가능하며 OPEX (OPerating EXpenditure) 측면에서는 추가적인 비용이 들지 않

고 전력소모가 작아 유지 비용이 적게 소요되는 장점이 있다[6]

CISCO의 시장 전망 분석에 의하면 모바일 기기에서 와이파이 및

소형셀 네트워크를 통해 오프로딩되는 모바일 트래픽은 계속 급증할 것으로

전망하고 있으며 2018년이 되면 모바일 네트워크 상에서 생성되는 트래픽을

능가할 것으로 예상하고 있다[3] 앞으로 소형셀은 매크로 셀을 보완하여 추

가적인 용량을 제공하는 기존 개념에서 발전하여 가정과 사무실에 독자적으

로 용량을 제공하여 모바일 네트워크의 핵심 요소로 자리매김 할 것으로 예

상된다 소형셀 포럼에서 발표한 2014년 3월 31일 기준 전세계 소형셀 배치

현황은 다음과 같다[7]

3

- 84 million smallcells overall

- 81 million residential femto cells

- 123000 enterprise smallcells

- 120000 indoor urban smallcells

- 6980 outdoor urban smallcells and

- More than 2050 rural smallcells are deployed worldwide

현재는 대부분의 소형셀이 주거용 펨토셀로 구성되어 있으며 앞으로 다

양한 종류의 소형셀 수가 증가할 것으로 전망하고 있다 전 세계적으로 소형

셀을 도입하는 사업자수가 빠르게 증가하고 있어 앞으로 소형셀은 소형셀

기지국 역할 뿐만 아니라 가정에서 인터넷 서비스의 중심이 될 것으로 예상

된다 이렇게 나날이 증대되는 소형셀 신규 서비스들이 발생시킬 트래픽들은

코어망의 부담을 가중시킬 수 있다 따라서 소형셀 환경에서 코어망 트래픽

집중을 방지하기 위한 트래픽 오프로딩 방안으로 캐싱에 대한 연구가 필요

하다 특히 소형셀 특징에 적합하게 코어망의 부하를 줄이기 위한 캐싱 기법

은 필요성과 개략적인 시나리오만 제시될 뿐 아직 구체적인 방법과 표준이

나오지 않아 연구가 시급하다

본 논문에서는 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하

를 감소시키는 하나의 방안으로 소형셀 환경에 최적화된 새로운 local caching

알고리즘을 개발하고자 한다 본 논문의 구성은 다음과 같다 2장에서는 소형

셀 포럼의 연구 진행 상황을 파악하고 기존 웹 캐시 방식과 최근 제안되는

소형셀 캐시 알고리즘에 대해 분석한다 3장에서는 local caching 관점에서 소

형셀 사용자 특성을 적용한 네트워크 구조를 도출하고 이를 반영한 새로운

local caching 알고리즘을 제안하였다 4장에서는 시뮬레이션 환경을 설계하고

성능 분석 모델링을 통한 성능을 평가하고 5장에서 결론을 맺는다

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 12: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

2

표 1 기지국 분류

Table 1 Classification of base station

indoor outdoor

펨토셀 피코셀 펨토셀 피코셀 마이크로셀 매크로셀

전송파워 10mW

~100mW

100mW

~250mW 900mW~1W 1~5W 5~10W 10W 이상

커버리지 100~200m 250~500m 500~700m 05~15km 1~3km 1~25km

평균크기 5times8cm 10times10cm 20times20cm 20times30cm 40times30cm 50times60cm

무게 1kg 15kg 2~3kg 2~4kg 4~6kg 10~15kg

최대

사용자수 8~16 명 16~64 명 8~32 명 16~64 명 64~256 명 256 명 이상

구축장소 가정 가정기업 가로등 벽 가로등 벽 옥상전신주 타워마스트

일반적으로 표 1과 같이 안테나당 10W급 이하 기지국 장비나 피코셀

펨토셀 등을 통칭해 소형셀이라 한다[5] 소형셀은 매크로셀에 비해 기지국

크기가 작아 공간 대비 인구가 밀집된 장소에 설치가 용이하다 CAPEX

(CAPital EXpenditures) 측면에서는 초기 설치비가 적게 들고 단기간에 설치가

가능하며 OPEX (OPerating EXpenditure) 측면에서는 추가적인 비용이 들지 않

고 전력소모가 작아 유지 비용이 적게 소요되는 장점이 있다[6]

CISCO의 시장 전망 분석에 의하면 모바일 기기에서 와이파이 및

소형셀 네트워크를 통해 오프로딩되는 모바일 트래픽은 계속 급증할 것으로

전망하고 있으며 2018년이 되면 모바일 네트워크 상에서 생성되는 트래픽을

능가할 것으로 예상하고 있다[3] 앞으로 소형셀은 매크로 셀을 보완하여 추

가적인 용량을 제공하는 기존 개념에서 발전하여 가정과 사무실에 독자적으

로 용량을 제공하여 모바일 네트워크의 핵심 요소로 자리매김 할 것으로 예

상된다 소형셀 포럼에서 발표한 2014년 3월 31일 기준 전세계 소형셀 배치

현황은 다음과 같다[7]

3

- 84 million smallcells overall

- 81 million residential femto cells

- 123000 enterprise smallcells

- 120000 indoor urban smallcells

- 6980 outdoor urban smallcells and

- More than 2050 rural smallcells are deployed worldwide

현재는 대부분의 소형셀이 주거용 펨토셀로 구성되어 있으며 앞으로 다

양한 종류의 소형셀 수가 증가할 것으로 전망하고 있다 전 세계적으로 소형

셀을 도입하는 사업자수가 빠르게 증가하고 있어 앞으로 소형셀은 소형셀

기지국 역할 뿐만 아니라 가정에서 인터넷 서비스의 중심이 될 것으로 예상

된다 이렇게 나날이 증대되는 소형셀 신규 서비스들이 발생시킬 트래픽들은

코어망의 부담을 가중시킬 수 있다 따라서 소형셀 환경에서 코어망 트래픽

집중을 방지하기 위한 트래픽 오프로딩 방안으로 캐싱에 대한 연구가 필요

하다 특히 소형셀 특징에 적합하게 코어망의 부하를 줄이기 위한 캐싱 기법

은 필요성과 개략적인 시나리오만 제시될 뿐 아직 구체적인 방법과 표준이

나오지 않아 연구가 시급하다

본 논문에서는 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하

를 감소시키는 하나의 방안으로 소형셀 환경에 최적화된 새로운 local caching

알고리즘을 개발하고자 한다 본 논문의 구성은 다음과 같다 2장에서는 소형

셀 포럼의 연구 진행 상황을 파악하고 기존 웹 캐시 방식과 최근 제안되는

소형셀 캐시 알고리즘에 대해 분석한다 3장에서는 local caching 관점에서 소

형셀 사용자 특성을 적용한 네트워크 구조를 도출하고 이를 반영한 새로운

local caching 알고리즘을 제안하였다 4장에서는 시뮬레이션 환경을 설계하고

성능 분석 모델링을 통한 성능을 평가하고 5장에서 결론을 맺는다

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 13: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

3

- 84 million smallcells overall

- 81 million residential femto cells

- 123000 enterprise smallcells

- 120000 indoor urban smallcells

- 6980 outdoor urban smallcells and

- More than 2050 rural smallcells are deployed worldwide

현재는 대부분의 소형셀이 주거용 펨토셀로 구성되어 있으며 앞으로 다

양한 종류의 소형셀 수가 증가할 것으로 전망하고 있다 전 세계적으로 소형

셀을 도입하는 사업자수가 빠르게 증가하고 있어 앞으로 소형셀은 소형셀

기지국 역할 뿐만 아니라 가정에서 인터넷 서비스의 중심이 될 것으로 예상

된다 이렇게 나날이 증대되는 소형셀 신규 서비스들이 발생시킬 트래픽들은

코어망의 부담을 가중시킬 수 있다 따라서 소형셀 환경에서 코어망 트래픽

집중을 방지하기 위한 트래픽 오프로딩 방안으로 캐싱에 대한 연구가 필요

하다 특히 소형셀 특징에 적합하게 코어망의 부하를 줄이기 위한 캐싱 기법

은 필요성과 개략적인 시나리오만 제시될 뿐 아직 구체적인 방법과 표준이

나오지 않아 연구가 시급하다

본 논문에서는 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하

를 감소시키는 하나의 방안으로 소형셀 환경에 최적화된 새로운 local caching

알고리즘을 개발하고자 한다 본 논문의 구성은 다음과 같다 2장에서는 소형

셀 포럼의 연구 진행 상황을 파악하고 기존 웹 캐시 방식과 최근 제안되는

소형셀 캐시 알고리즘에 대해 분석한다 3장에서는 local caching 관점에서 소

형셀 사용자 특성을 적용한 네트워크 구조를 도출하고 이를 반영한 새로운

local caching 알고리즘을 제안하였다 4장에서는 시뮬레이션 환경을 설계하고

성능 분석 모델링을 통한 성능을 평가하고 5장에서 결론을 맺는다

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 14: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

4

제 2 장 관련 연구

제 1 절 소형셀 포럼 연구 진행 상황

소형셀 포럼은 소형셀의 발전과 모바일 네트워크의 형태 변화를 통한

모바일 서비스 향상을 목표로 만들어진 조직이다 소형셀의 시장 요인 상업

적 사례를 비롯하여 구조 표준 규제 등을 포함한 기술 정보에 대한 문서를

지속적으로 발표하고 있다

그림 1 소형셀 포럼 연구 진행상황 51[8]

Fig 1 Research progress of Smallcell Forum

소형셀 포럼에서는 2013년 2분기 lsquoRelease ONE Homersquo을 시작으로 현재

lsquoRelease FOUR Urbanrsquo까지 발간하였으며 2015년 2월 lsquoRelease FIVE Ruralrsquo에

대한 문서가 나올 것으로 예정되어 있다 기존 소형셀 포럼의 연구 결과에

의하면 소형셀은 네 가지 형태로 분류할 수 있다 Home 소형셀은 현존하는

소형셀 중에 가장 규모가 작은 단위의 가정용 혹은 작은 사무실용 소형셀이

다 Enterprise 소형셀은 회사 소형 사무실처럼 비교적 면적이 작은 공간에 설

치되며 home 소형셀과 비교하여 사용자가 많은 경우 셀 간 무선 주파수 이

용이 증가하는 경우 이동성에 따라 다른 셀로의 핸드오버가 일어나는 경우

셀 당 커버리지 면적이 비교적 넓은 경우에 해당된다 Urban 소형셀은 셀의

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 15: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

5

크기가 커진 대도시 규모에 해당된다 소형셀 포럼은 urban 소형셀 배치 시

요구사항 백홀에 관한 요구사항 네트워크 구조 기지국 간 X2 인터페이스

요구사항 SON (Self Organizing Network) use case 등에 대한 연구를 진행하고 있

다[9] Rural 소형셀은 일시적인 재난지역 혹은 배나 비행기 등에서 사용되며

내년 상반기에 문서가 발간될 예정이다

제 2 절 기존 웹 캐시 기술

웹 캐시 서비스는 과거 사용자의 요청에 의해 사용된 이력이 있는 웹

콘텐츠를 저장하고 있다가 재 요청이 있을 경우 원본 서버에 요청하지 않고

저장한 콘텐츠를 직접 전송하는 방식이다 이를 통해 지연 시간을 최소화하

여 신속한 웹 서비스를 제공하고 반복되는 데이터 전송을 최소화 함을 통해

원본 서버의 부하를 감소시켜 네트워크 대역폭을 절약할 수 있다

콘텐츠를 저장하는 기본적인 두 가지 캐시 방식은 predictive caching 방식

과 proactive caching 방식이 있다 Predictive caching 방식은 사용자가 앞으로 요

청할 데이터를 예상하여 코어망이 비교적 한가한 시간에 미리 콘텐츠를 저

장하는 방식이고 proactive caching 방식은 사용자가 요청하는 데이터를 즉석

에서 저장하는 방식이다 Proactive caching 방식의 일종으로 URL (Uniform

Resource Locator) 기반 웹 캐시 방식과 prefix 기반 웹 캐시 방식으로 나눌 수

있다 URL 기반 웹 캐시 방식은 URL 주소의 대부분이 하나의 콘텐츠로 구분

할 수 있기 때문에 사용자가 구체적인 URL 주소를 요청했을 경우 미들박스

에 캐시 된 같은 URL 주소를 가진 콘텐츠를 전달해 주는 방식이다 Prefix 기

반 웹 캐시 방식은 URL 기반 웹 캐시 방식의 진화된 버전으로 미디어 데이

터의 최초 일부를 캐시에 저장하는 기법이다 그러나 이 기법은 미디어 콘텐

츠를 스트리밍 할 때 사용빈도와 중요도 등 스트리밍 결정 요소가 고려되지

않아 데이터 패킷 처리 시 많은 손실이 발생한다[10]

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 16: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

6

캐시에는 저장할 수 있는 공간이 한정되어 있기 때문에 캐시 서버의 공

간이 부족하게 되면 효율을 높이기 위해 캐시 내 문서를 제거해야 된다 이

때 사용되는 캐시 교체 정책에 따라 성능에 많은 영향을 주게 된다 기존 웹

캐시에서 많이 사용되고 있는 캐시 교체 방식은 다음과 같다

Least Recently Used (LRU) [11]

사용자의 최근 웹 객체 사용 빈도 이력을 이용하여 캐시에 저장되어 있

는 객체 중 가장 적게 이용된 객체를 캐시에서 먼저 삭제하는 방식이다 과

거에 빈도 수가 많았지만 최근에 한동안 사용되지 않은 객체가 제거될 수

있는 단점을 가지고 있다

Least Frequently Used (LFU) [12]

사용 빈도가 가장 적은 객체를 캐시에서 삭제하는 방식이다 액세스 횟

수로만 객체의 가치를 판단하여 그 횟수가 많은 객체는 미래에도 사용될 확

률이 높기 때문에 캐시에 보존한다

Size-adjusted Least Frequently Used (SLRU) [13]

객체 크기에 대한 LRU 성능 비가 가장 작은 객체를 캐시에서 제거하는

방식이다 크기가 큰 객체를 저장하게 되면 캐시의 한정된 크기 때문에 여러

개의 크기가 작은 객체들이 저장되지 못하므로 제안되었다

Least Frequently Used Aging (LFU Aging) [14]

LFU 방식은 과거 일정 시간 동안 액세스 횟수가 높았던 객체는 오랜 시

간 요청이 없더라도 높은 가치를 가지고 있어 캐시에 저장되어 있게 된다

이러한 문제점을 해결하기 위해 액세스 횟수가 정해진 임계값을 넘게 되었

을 경우 새로운 빈도 값을 갖게 하는 방식이다

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 17: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

7

Greedy Dual (GD) [15]

LRU 방식을 일반화할 수 있는 방식으로 객체의 크기는 모두 동일하다

고 가정하지만 페치 비용에 대해서는 객체마다 다르게 책정한다 페치 비용

이 큰 객체를 캐시에 오래 유지함으로서 기대되는 이득 값을 구해 이득이

가장 낮은 객체를 캐시에서 제거한다

Least Unified Value (LUV) [16]

LRU 방식과 LFU 방식의 단점을 보안하기 위한 방식이다 캐시에 존재

하는 모든 객체는 가까운 미래에 사용될 가능성을 정량화하기 위해 과거에

발생한 모든 사용 이력이 반영된 서로 다른 가치 값을 가진다 LFU 방식에서

는 과거 사용 이력이 동일한 가중치로 반영되지만 LUV 방식은 오래 전의

사용보다 최근의 사용에 더 높은 가중치를 부여한다

Criteria Weighted (CW) [17]

객체의 가치를 평가하기 위해서 객체들의 크기 접근 빈도 최근에 사용

된 시간과 전송 범위 안의 이웃 피어들에게 해당 객체가 몇 개 있는지 정도

를 반영한 방식이다

First In First Out (FIFO) [18]

가장 먼저 저장된 객체를 우선적으로 캐시에서 제거하는 방식이다 구현

이 용이하지만 시간적으로 오래된 블록을 교체하기 때문에 효율성을 보장하

지 못한다

이 중 LRU와 LFU는 웹 캐시 분야의 전통적인 교체 알고리즘으로 단순

하고 견고하기 때문에 가장 널리 사용되고 있다

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 18: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

8

제 3 절 소형셀 캐시 기술

제 1 항 소형셀 캐시 저장 시나리오

소형셀 포럼에서는 미래 소형셀 캐시 서비스가 실현될 경우 캐시 공간

이 어떠한 형태로 할당될 것인가에 대해 각 소형셀 별로 방안을 제시하고

있다 소형셀 포럼이 제시하는 방법은 기존의 웹 캐시 방식에서 벗어나 각

소형셀의 특징이 반영되었으며 구체적인 시나리오는 다음과 같다[19]

국부적 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 homeenterprise 소형셀 안에 캐시를 구축하는

가장 일반적인 방법이다 소형셀 내 캐시 저장 공간이 할당되고 캐시 요청

및 응답 메시지를 통해 소형셀과 망 사업자간의 캐시가 연결된다 사용자는

storage pointer를 이용하여 캐시를 직접 관리 할 수 있고 코어망을 우회할 수

있다 실제 트래픽을 관리하고 캐시 운영의 부담을 줄여 사업자 코어 네트워

크의 보조 역할을 한다

기업적 소형셀 캐시 저장 시나리오

기업과 같은 규모에서 캐시 기능이 있는 소형셀의 구축을 원하는 경우

에 해당한다 기업은 방화벽처럼 모든 사용자들의 캐시를 허락하지 않고 해

당 기업 사원들만 접근 가능한 closed 모드로 동작하게 한다 따라서 국부적

소형셀 캐시 저장 시나리오와는 다르게 암호화를 위한 요구사항이 반영된

캐시 환경설정이 필요하다 또한 파일의 암호화와 접근 정책 매커니즘 등 도

추가적인 요구사항들이 필요하다

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 19: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

9

그림 2 국부적 소형셀 캐시 저장 시나리오

Fig 2 Localized smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Data Store Event Info

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 20: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

10

그림 3 기업적 소형셀 캐시 저장 시나리오

Fig 3 Enterprise managed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Storage Policy Configuration

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Set Storage Access PolicyRequest

Subscribe to Data StoreEvent

Data Store Event Info

Set Storage Access PolicyResponse

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 21: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

11

분산적 소형셀 캐시 저장 시나리오

커피숍 체인점과 같은 형태로 물리적인 거리로는 분산되어 있지만 유형

이 비슷한 사용자들이 모일 확률이 높아 접근하는 트래픽에 상당한 유사성

을 보이는 경우에 해당된다 커피숍 체인점이나 사업자가 POP (Point Of

Presence) 역할을 하여 고객들이 선호하는 특정 스트리밍 콘텐츠를 제공하고

광고를 통한 수익을 낼 수 있다 그림 4의 Smallcell zone service의 manager는

각 소형셀의 정보를 수집하고 유효성을 모니터링하며 유지하고 분석한다 이

정보는 availability request에 대한 응답과 콘텐츠 QoE 요구사항 등 구체적인

요청에 대한 응답이 될 수 있다 요청이 생성될 때 마다 smallcell zone service

에서 가상 캐시를 만들어 캐시의 pointer 역할을 한다 가상 캐시는 소형셀

지역 관리를 위해 새롭게 제공되는 서비스이며 이는 실제 storage 할당을 할

수 있다

Urban 지역 소형셀 캐시 저장 시나리오

모바일 네트워크 사업자가 urban 지역에 소형셀을 설치하는 경우 인구

밀집도가 높은 야외와 실내에 복합적으로 설치되어 네트워크 용량을 늘리고

매크로셀이 도달할 수 없는 범위까지 넓은 커버리지를 갖게 되는 경우에 사

용된다 소형셀 캐시를 이용하면 백본의 트래픽을 줄여 커패시티와 커버리지

요구사항을 만족시킬 수 있다 그림 5는 urban 지역에서도 국지적인 경우로

저장 공간 할당을 요청할 때 smallcell zone service는 사업자 네트워크 내에서

subscribed service level을 정하기 위해 사용자 정보 데이터베이스를 이용한다

사용자의 subscribed service level을 바탕으로 각기 다른 스토리지 공간을 할당

해준다

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 22: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

12

그림 4 분산적 소형셀 캐시 저장 시나리오

Fig 4 Distributed smallcell storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Storage

Data Store Event Info

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Send Content toVirtual Cache

Allocate Storage

Send Content toPhysical Storage

CreateVirtual Cache

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 23: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

13

그림 5 Urban 지역 소형셀 캐시 저장 시나리오

Fig 5 Urbanmetro smallcell localized storage use case

Small CellStorage

SmallCellZoneService

Application(eg CDN)

SmallCellZone Service AccessData Store Status

(on-going)

Allocate Requested Storage

Manage Data Store (direct access data bypasses MNO Core)

SmallCellZone CacheAvailability Request

SmallCellZone CacheAvailability Response

Create Edge CacheRequest

Create Edge CacheResponse

Subscribe to Data StoreEvent

Data Store Event Info

Install Access Policy

Determine userservice level

Create PolicyObject

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 24: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

14

제 2 절 소형셀 캐시 알고리즘

다양한 논문에서 제안하고 있는 소형셀 기반 캐시 알고리즘에 대한 연

구는 다음과 같다

Reactive-user preference profile [20]

비디오를 분산적으로 캐시 하는 방법으로 상대적으로 큰 사이즈의 캐시

에 저장하는 기존 캐시 기법 구조와 달리 소형셀 구조의 많은 수의 작은 사

이즈의 캐시로 가정한다 새로운 비디오가 요청되었을 때 현재 캐시에 저장

되어 있지 않으면 이 새로운 비디오를 저장하고 이후 캐시가 꽉 차면 UPP

(User Preference Profile)를 토대로 가장 요청이 없을 것 같은 비디오를 캐시에

서 삭제하고 새로 요청한 비디오를 저장한다

Proactive-user preference profile [20]

UPP을 토대로 가장 많이 요청될 것 같은 비디오를 미리 캐시에 저장하

는 방법으로 AUS (Active User Set)에 따라 달라지는 UPP를 반영한다 AUS가

자주 바뀌면 이에 따른 UPP와 MLR (Most Likely Requested video)이 새로 계산

되어야 하기 때문에 계산 복잡도가 증가하고 업데이트 오버헤드가 증가하게

된다 따라서 비디오 교체로 인한 예상 hit ratio가 미리 정한 threshold 값 이

상이면 캐시를 업데이트 하는 업데이트 기법을 제안하고 있다

Proactive popularity caching [21]

요청된 파일의 popularity 통계정보에 근거해서 캐시를 결정하는 proactive

popularity caching 기법이다 Popularity profile은 크게 3가지로 이루어져 있는데

사용자가 파일을 요청할 확률을 2차원으로 나타내는 local file popularity matrix

소형셀이 사용자와 연결여부를 나타내는 connectivity matrix 사용자가 일정

시간 동안 파일을 요청하는 횟수인 user request rate의 곱으로 이루어진다

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 25: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

15

Proactive popularity caching 기법은 popularity profile을 토대로 각 소형셀별로 인

기 있는 파일 순서대로 캐싱한다 이때 특정 소형셀 캐시 저장 공간이 가득

차면 해당 소형셀의 캐시를 멈춘다

Combinatorial upper confidence bound [22]

Popularity profile을 알지 못한 상태에서 소형셀에 캐시 된 트래픽을 최대

한 많이 사용하도록 캐시 할 최적화 file set을 찾는 캐싱 알고리즘을 제안하

고 있다 이 알고리즘의 목적은 시간 t 동안 expected reward가 최대가 되는

file set을 찾는 것이다 여기서 expected reward란 소형셀에 캐시함으로서 얻을

수 있는 보상으로 QoE 이득이나 코어망의 대역폭 감소 등이 고려될 수 있다

expected reward가 최대가 되는 file set을 찾는 것은 최적으로 content가 캐시

됐을 때 얻을 수 있는 reward와 어떤 content를 캐시 했을 때 expected reward

의 차이를 최소화하는 file set을 찾기 위해 자주 캐싱되지 않는 파일의

expected reward값을 인위적으로 증가시킨 popularity profile을 토대로 캐싱 할

file set을 구하며 최적화된 캐싱 file set을 얻을 때까지 과정을 반복한다

기존에 제시되고 있는 소형셀 캐시 알고리즘은 소형셀 사용자의 특성이

반영되지 않고 단지 소형셀의 작은 캐시 사이즈만 고려하거나 특정 소형셀

사용자의 특성이 아닌 일반적인 사용자의 preference에 의존하고 있다 따라

서 소형셀에 최적화 알고리즘이 아닌 기존의 웹 캐시 방식과 유사한 형태를

보이고 있다 또한 비디오에 국한되거나 가상의 파일이라는 일관적인 데이터

크기를 전제하고 있어 알고리즘의 현실성이 떨어진다 본 논문에서는 소형셀

과 소형셀 사용자의 특성이 반영된 local caching 알고리즘을 제안하고자 한다

이 때 사용되는 트래픽과 웹 페이지의 크기 및 소형셀의 사용자의 검색 행

태 등은 모두 실제 자료에 기반하고자 한다

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 26: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

16

제 3 장 소형셀 Local caching 알고리즘 제안

제 1 절 Local caching 관점에서 소형셀 특징

소형셀 포럼에서 설치 지역 및 서비스 목적에 따라 분류한 네 가지 소

형셀 종류를 Local caching 목적으로 소형셀 사용자들의 관점에서 다시 세 가

지 분류로 정리 할 수 있다

Homeenterprise 소형셀

개인의 취향과 성격 특징이 비슷한 사용자들끼리 같은 소형셀을 사용할

확률이 높다 또한 근접 소형셀 사용자들의 성향 유사도가 높다 예를 들어

한 회사내의 직원들은 웹 페이지에서 유사한 데이터를 검색한다 이 경우 같

은 소형셀을 사용하는 사용자들의 특징을 파악하면 캐시 해야 할 콘텐츠를

어느 정도 예측할 수 있다

Urban 소형셀

Urban 소형셀에 동시 접속하는 사용자 수는 많지만 배치되는 장소가 공

항 놀이공원 경기장 등 대부분 특정한 목적을 가지고 있는 경우에 해당한

다 따라서 각 장소에 맞게 동일한 목적을 가진 사용자들이 모일 확률이 높

다 예를 들어 야구장에서는 그 날 경기중인 해당 구단 및 선수의 정보를 검

색할 것이다 따라서 사용자들이 요구하는 트래픽을 어느정도 예측할 수 있

어 캐시를 해야 할 콘텐츠와 키워드가 정해져 있다

Rural 소형셀

일시적인 재난지역 배나 비행기 같은 이동성이 있는 교통 수단 고립된

지역 등 특수한 상황이나 사용자 범위가 넓어 소형셀 사용자들의 특징 및

목적을 가늠하기 어려워 캐싱의 대상을 정하기 어렵다

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 27: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

17

본 논문에서는 소형셀 사용자 특징을 활용한 캐시 기술을 제안하고자

한다 따라서 소형셀 사용자 특징을 적극 반영할 수 있는 homeenterprise 소

형셀을 전제로 local caching 알고리즘을 제안한다 Homeenterprise 소형셀 사용

자들의 성향 유사도를 확인하기 위해서는 소형셀 사용자 집단에 대한 분석

이 필요하다 이를 위해 Squid 서버를 설치하고 일정기간 로그 기록을 수집

하였고 SARG를 이용하여 웹 페이지 로그 파일을 분석하였다 Squid는 오픈

소스 소프트웨어로 제공되는 프록시 서버이자 웹 캐시이다 반복된 요청을

캐시함으로서 추후 사용자들이 같은 사이트로 접속을 시도할 때 캐시서버의

저장된 데이터를 전달하여 웹 서버의 속도를 향상시켜준다 또한 접근통제

등 네트워크 보안을 유지할 때에도 사용할 수 있다 실제 아주대학교 무선인

터넷연구실 소속 대학원생을 대상으로 2014년 9월 한달 동안 Squid 서버를

이용하여 로그 기록을 수집하였다 집단의 구성원은 대부분 남자이며 20대와

30대가 고루 섞여있다 수집된 로그 기록 분석을 통한 최다빈도 사이트 결과

는 표 2와 같다 먼저 집단 구성원들이 가장 많이 접속한 사이트는 아주대학

교 아주대학교 포탈 아주대학교 메일 사이트로 집단의 특성이 적극 반영되

었음을 알 수 있다 IEEE Explore 사이트도 높은 유입 기록 횟수를 보여주며

대학원생 집단의 특성을 반영하고 있다 또한 실험 집단은 일반적인 대학생

의 특징 혹은 일반적인 젊은 남자의 특징을 보여주고 있다 뉴스 카페 라디

오 쇼핑 토렌트 등은 대학생 집단의 특징을 보여주고 축구 휴대폰 사이트

등은 젊은 남자 집단의 특징을 대표한다 추가적으로 로그 기록 중 코레일의

경우 9월 중 추석 명절이 포함되었기 때문에 나타난 결과로 수집 기간의 특

수성인 예외적인 결과로 볼 수 있다 Squid 서버를 이용한 로그 기록 수집을

통해 homeenterprise 소형셀 환경에서 같은 소형셀에 접속한 사용자들의 성

향 유사도가 높음을 확인하였다 이 결과를 통해 동일한 소형셀에 존재하는

사용자들은 서로 비슷한 키워드를 검색하게 됨을 볼 수 있었다

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 28: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

18

표 2 Squid 최다 방문 사이트

Table 2 Top visited site by Squid

Accessed site Type Connect Mbytes Time

wwwajouackr 아주대학교 7496K 31567 00822

portalajouackr 아주대학교 3264K 9880 00354

mailajouackr 아주대학교 1631K 5775 00402

wwwletskorailcom 코레일 1402K 10978 00419

advetnewscom 뉴스 1337K 1754 00259

lm7cafenavercom 네이버 카페 1265K 6579 00829

cafenavercom 네이버 카페 1249K 4316 03146

staticieeexploreieeeorg IEEE Explore 1053K 2265 01404

wwwetnewscom 뉴스 899K 839 00244

kongkbscokr 인터넷 라디오 802K 1407 00115

aimsajouackr 아주대학교 702K 26456 00614

statickosafgokr 한국장학재단 683K 15007 00345

shoppingphinfnavernet 쇼핑 635K 3579 02952

highburycokr 축구 542K 4439 00433

wwwmrkooncokr 해외구매대행 290K 2906 00142

wwwtosarangnet 토렌트 285K 3061 00355

imagegmarketcokr 쇼핑 258K 1543 00419

wwwppomppucokr 휴대폰 199K 629 00134

wwwhotponcokr 휴대폰 187K 948 00027

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 29: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

19

제 2 절 Local caching 을 위한 네트워크 구조

LTE 네트워크 참조 모델에 기반하여 소형셀 local caching 알고리즘이 적

용될 경우 예상되는 네트워크 구조는 그림 6과 같다 기존 LTE 네트워크 모

델에서 추가되는 환경은 다음과 같다

SC-GW (Small Cell Gate Way)

캐시 기능이 있는 소형셀이 구축되는 곳에는 SC-GW가 존재하여 단말의

이동성과 서비스를 관리하게 된다 CSG (Closed Subscriber Group) 리스트를 만

들어 사용자의 권한에 따라 접속을 허가한다

SC과 eNB 간 X2 interface

기존 기지국과 소형셀 기지국 사이의 연결 혹은 소형셀 기지국 간의 연

결을 통해 기지국 정보를 주고 받을 수 있다

Cache

실제 데이터가 저장되는 공간으로 SC-GW에 의해 관리된다

S-GW P-GW

PCRFMMEeNB

SC

UE B

UE A

SGi

S7

S5S1

X2

S1-U

S1-MME

S1-U

S11

S11

SC-GW Internet

Public Core

Cache

그림 6 Local caching 알고리즘에 적용한 LTE 네트워크 구조

Fig 6 LTE network architecture for proposed local caching algorithm

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 30: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

20

기존 LTE 네트워크 모델에서 EPC (Evolved Packet Core) 엔티티와 인터페

이스의 주요 기능은 다음과 같다

표 3 LTE 엔티티와 인터페이스 주요 기능

Table 3 Function of LTE entity and interface

엔티티

인터페이스 기능

MME

(Mobility

Management Model)

사용자 인증을 위해 HSS (Home Subscriber Server)와 통신하고

NAS (Non Access Control) 시그널링을 통해 EPS (Evolved Packet

System) 이동성 관리 및 EPS 세션 관리 기능을 제공한다

S-GW

(Serving-Gate Way)

eNB 및 P-GW와 연동하여 가입자의 트래픽 경로 제공하며

eNB 간 핸드오버 시 이동성 anchoring point가 된다

P-GW

(Packet data

network-Gate Way)

단말을 외부 PDN 망과 연결해주며 패킷 filtering을 제공한다

단말에게 IP 주소를 할당하고 3GPP와 non-3GPP 간 핸드오버

시 mobility anchoring point로 동작한다

PCRF

(Policy Charging

Resource Function)

서비스 정보 수집 및 망 운용자의 정책에 따라 서비스 권한

검증을 수행한다 네트워크 대역폭 할당을 위한 품질보증 정

책 설정 기능과 흐름 기반의 과금 관리 기능을 제공한다

X2 eNB 간 인터페이스로 핸드오버 시 데이터 forwarding을 위해

베어러 당 GTP (GPRS Tunneling Protocol) 터널링을 제공한다

S1-U 베어러 당 GTP 터럴링을 제공한다

S1-MME eNB와 MME 간 인터페이스로 제어 평면을 정의한다

S5 사용자 평면에서 베어러당 GTP 터널링을 제공하고 제어평면

에서 GTP 터널 관리를 제공한다

S7 PCRF와 P-GW 간 정책 제어 정보를 교환한다

S11 MME와 S-GW 간 인터페이스로 제어 평면을 정의하고 베어

러 당 GTP 터널링을 제공한다

SGi P-GW와 PDN 간 연결을 제공한다

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 31: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

21

그림 6에서 제안하는 알고리즘이 적용될 경우 가능한 시나리오는 크게

두 가지가 있다 먼저 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재하지

않을 경우 기존의 방식대로 코어망으로부터 페이지를 불러와야 한다 다운링

크 과정은 경로 1과 같이 복잡한 절차를 거치게 된다

(경로 1) Internet rarr P-GW rarr S-GW rarr SC-GW rarr SC rarrUE A

만일 단말 A가 요청하는 트래픽이 소형셀 캐시에 존재한다면 경로 2와

같이 절차가 간략해진다

(경로 2) Cache rarr SC-GW rarr SC rarr UE

소형셀의 특성상 물리적으로 인접한 소형셀 사용자들은 성향이 유사할

확률이 매우 높다 예를 들어 영통구 매탄 1동에 거주하는 사람들과 매탄 2

동에 거주하는 사람들은 lsquo영통구청 맛집rsquo을 검색할 확률이 높고 아주대 공대

건물을 사용하는 학생들과 경영대 건물을 사용하는 학생들은 lsquo아이폰 6rsquo에

관심이 있다 이러한 특징은 두 eNB간 X2 인터페이스를 이용하여 트래픽 효

율을 높일 수 있다 X2 인터페이스는 서로 인접한 기지국 간의 정보를 주고

받을 수 있는 장점이 있다 이를 이용하여 만약 단말 B가 요청하는 트래픽이

소형셀 캐시에 존재한다면 경로 3과 같은 절차를 통해 기존의 방식보다 짧

은 경로를 이용할 수 있다

(경로 3) Cache rarr SC-GW rarr SC rarrUE B

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 32: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

22

제 3 절 소형셀 최적화 된 Local caching 알고리즘

제안하는 local caching 알고리즘은 소형셀 사용자들이 서로 유사한 성향

을 가지고 있으므로 그 특징을 파악하여 적절한 트래픽을 미리 캐시에 저장

하는 것이다 구체적으로 소형셀 사용자 집단의 특성과 지역적인 특성을 적

용한 local caching 알고리즘을 제안하고자 한다 제안하는 알고리즘의 목적은

상대적으로 규모가 작은 소형셀에 접속한 이용자들의 성향을 충분히 반영하

여 요청될 트래픽을 예측하고 캐시에 저장함으로서 코어망의 부하를 감소시

킬 수 있는 최대의 효율을 만들어 내고자 하는 것이다 이를 위한 하나의 수

단으로 포털 사이트의 검색어를 이용한 알고리즘을 제안하고자 한다

제안하는 알고리즘에서는 국내 주요 검색 포털 사이트 중 전체 시장의

73의 점유율을 차지하고 있는 네이버 검색어를 이용하고자 한다 네이버가

제공하는 검색 서비스 중 일반적으로 모든 사람이 관심을 갖는 실시간 인기

검색어와 소형셀의 특성이 반영될 수 있는 타겟 별 인기 검색어 지역별 인

기 검색어를 활용하였다 각 검색어의 정의와 특징은 다음과 같다[23]

실시간 인기 검색어

실시간 인기 검색어는 단위 시간 동안 네이버의 검색창으로 입력되는

검색어를 분석해 입력 횟수의 증가 비율이 가장 큰 검색어 순서대로 보여주

는 서비스이다 실시간 인기 검색어는 이용자들의 관심도를 나타내며 이를

이용해 매일 일반적으로 사용자들이 많이 요청하는 트래픽의 키워드와 종류

를 알 수 있다 실시간 인기 검색어는 다음과 같은 순위 선정 알고리즘을 통

해 만들어 진다

① 특정 기준 시간 내에 사용자가 검색창에 집중적으로 입력하여 과거

시점에 비해 또한 다른 검색어에 비해 상대적으로 순위가 급격하게 상승한

비율을 기준으로 순위를 선정한다

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 33: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

23

② 동일인이 특정 기준 시간 동안 같은 검색어를 두 번 이상 입력할 경

우 한번 입력한 것과 동일하게 계산된다

③ 차트에 이미 노출되고 있는 검색어를 클릭한 경우는 검색 횟수에 포

함되지 않으며 검색창에 직접 입력되거나 혹은 자동 완성된 검색어만이 집

계에 포함된다

④ 특정 시간대에 일상적으로 많이 입력되는 검색어는 급상승 검색어로

규정하지 않는다

타겟별 인기 검색어

최근 유사한 검색 행태를 보였던 사용자들이 입력하는 검색어 중 현재

가장 많이 입력한 검색어를 집계해 각 사용자 그룹별 실시간 관심사가 무엇

인지 순위 형식으로 보여주는 서비스이다 한 시간에 한 번씩 새롭게 업데이

트 되며 싱글남 싱글녀 직장인 재테크족 주부 대학생 청소년으로 분류하

고 있다 제안하는 알고리즘에서는 Squid를 통해 확인한 집단 표본과 동일한

집단 그룹인 대학생 인기 검색어를 이용하였다

지역별 주변 인기 검색어

지역별 주변 인기 검색어는 검색어에 포함된 지역 또는 그 시간대에 동

일 지역에서 가장 많이 검색된 검색어 지역의 관심사를 보여 주는 검색어

서비스이다 지정된 100여 개 지역명을 검색하였을 경우 지역별 주변 인기

검색어가 제공되고 일부 지역에서는 검색어와 관계없이 제공되기도 한다

또한 PC의 IP 주소정보를 확인하여 해당 IP 주소가 속하는 대역의 위치정보

를 대략적으로 확인하여 지역별 주변 인기 검색어 서비스를 제공한다 제안

하는 알고리즘에서는 타겟별 인기 검색어의 경우 대학생 검색어를 이용하고

지역별 인기 검색어의 경우 아주대학교 원천관에서 항상 접속한 영통구 주

변 인기 검색어를 이용하였다

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 34: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

24

제안하는 알고리즘은 세 가지 단계로 구분할 수 있다

단계 1 소형셀 사용자 정보 파악

소형셀 사용자 그룹을 싱글남 싱글녀 직장인 재테크족 주부 대학생

청소년 중 소형셀 사용자 특성과 가장 유사한 그룹 하나를 선정한다 이는

사용자가 직접 설정하거나 Squid 등 로그 분석을 통해 알아낼 수 있다 혹은

집단의 과거 검색기록을 이용하여 파악할 수 있다

또한 소형셀이 위치한 장소를 선정한다 이 역시 사용자가 직접 설정하

거나 위치 정보를 이용하여 구 단위까지 파악한다 또는 사용자의 과거 검색

키워드 중 위치와 관련된 정보에서 사용자의 위치를 유추할 수 있다

단계 2 캐시 사용 가능 용량 할당

소형셀에서 전체 가용 가능한 캐시 저장 공간을 파일 크기에 비례하여

할당한다 매 시각 실시간 인기 검색어 타겟 별 인기 검색어 지역 별 인기

검색어를 수집하여 파일의 크기를 점수화한다 분석한 파일 크기에 비례하여

전체 가용 캐시 저장 공간 대비 검색어 별 저장 공간을 할당하여 준다 캐시

공간 비율은 최초에 한번만 설정되어 유지되거나 주기적으로 변경될 수 있

단계 3 캐시 업데이트

캐치 초기 단계는 각 검색어 마다 할당된 캐시 사용 가능 용량까지 키

워드 관련 페이지를 채워준다 이후 한 시간마다 LRU 방식을 이용하여 캐시

내용을 교체하여준다 할당된 캐시 사용 가능 용량을 초과하게 되는 경우

캐시에 저장된 키워드와 최근 일정 기간 동안의 키워드를 비교하여 재사용

률이 제로인 키워드를 사용 가능 용량까지 제거한다

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 35: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

25

그림 7 캐시 업데이트 정책 순서도

Fig 7 Flow chart of the proposed cache update policy

Save web pages

at cache storage

Is the cache

storage is filled

tle 12

Set k=t-10 Set k=4

Compare keyword until t-k to t

with keyword at cache

Is there any

no-repeated keyword

Delete no-repeated keyword

until cache capacity

Is the cache capacity

still over

t-k=t-k+1

End

YES

YES

NO

NO

NO

YES

YES

NO

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 36: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

26

단계 3의 캐시 교체 방식에 대한 구체적인 순서도는 그림 7과 같다 최

근 4시간의 키워드와 현재 캐시에 저장된 키워드를 비교하는 방식으로 만약

12시전에 할당된 캐시 공간이 채워진다면 10시 이후의 키워드만 비교한다

캐시에 저장된 키워드가 최근 4시간 동안 다시 발생하지 않았다면 해당 키

워드에 저장된 페이지를 삭제한다 일부 키워드를 제거한 후에도 캐시 저장

공간이 부족하다면 최근 3시간의 키워드와 비교하여 가능한 캐시 저장 공간

까지 반복한다

그림 7의 순서도를 적용한 실제 예시는 그림 8에 나와 있다 그림 8은

12시의 캐시 내용을 채우는 과정이다 11시에 저장 된 캐시 리스트에 12시의

실시간 검색어를 추가하면 최대 저장용량인 20 슬롯을 넘게 된다 따라서 10

시부터 13시까지의 키워드와 12시의 캐시 내용을 비교하여 반복이 없는 키

워드와 관련된 페이지(노블레스 유웨이어플라이 윤석화)를 우선 제거한다

아직 최대 캐시 저장용량을 만족하지 못하였으므로 11시부터 13시까지의 키

워드와 한 번 더 비교한다 재 사용률이 제로인 키워드 중 랜덤으로 페이지

(비밀의 문)를 제거해 최대 캐시 저장용량에 맞춰준다

그림 9는 전체 단계에 대한 의사 코드를 나타내고 사용된 파라미터에

대한 설명은 표 4과 같다

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 37: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

27

그림 8 실제 적용 예시

Fig 8 Actual application example

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 38: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

28

Phase 1 Choose smallcell target user and location base on keyword

target user=single man single woman office worker investor

housewife university student teenager

location=specify area until borough unit

Phase 2 Allocate cache capacity each keyword

At time t each smallcell tracks a t b t c tK K K

Calculate a b ci t i t i tF F F during [110] t [922]i

Calculate a b ci t i t i tT F F F

Find T T a b ci t i t i tF F F T

Phase 3 Initial cache and update management

Save a tK at a tC during t [922]

If ( )a tC C

If ( 12)t then 9k t else 4k end if

Compare a tx C with tt t k a ty K

If a a 0( ( ) ( ) C )t tN x N x y then

While a a 0( ( ) ( ) C )t tN x N x y

1t k t k

0 ( )a t a t a tC C K x y until (x) Ca tN

reset tt t k a tK

end

else

While a( ( ) C )tN x

0 ( )a t a t a tC C K x y until (x) Ca tN

end

end if

else

Accumulate a tC

End if

Repeat b t c tK K

그림 9 소형셀 local caching 알고리즘 의사코드

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 39: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

29

Fig 9 Proposed algorithm for smallcell local caching

표 4 의사코드에 적용된 파라미터

Table 4 Parameter for pseudo code

Parameter Value

X a b c a =실시간 b =타겟 별 c =지역 별

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X tK

검색어 키워드

X

i tF

파일 크기

T 전체 키워드 파일 크기 합

각 키워드의 캐시 비율

C 전체 캐시 저장 가능 공간

X tC

t 시각의 캐시에 저장된 키워드

X tNC

t 시각의 캐시에 저장된 키워드 개수

0( )X tN x y

캐시에 저장된 키워드 (x) 와 최근 일정 기간 동안의 키워드

(y)를 비교하여 재 사용 확률이 0인 키워드의 개수

0( )a tK x y 0( )X tN x y 에 해당하는 키워드

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 40: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

30

제 4 장 성능 분석

제 1 절 소형셀 Local caching 환경 설계

제안하는 알고리즘의 성능을 평가하기 위해서는 소형셀 사용자와 캐시

에 대한 설계가 필요하다

제 1 항 소형셀 사용자 설계

하루 평균 네이버 검색어 입력 횟수는 1억 3천만회이고 네이버 검색 서

비스 하루 평균 방문자수는 1천 2백만명이다[24] 따라서 한 사람이 하루에

검색어를 입력하는 횟수는 약 1083회이다

표 5은 2014년 10월 23일부터 11월 5일까지 매일 검색되는 키워드 중

최다 빈도수를 보이는 상위 100개 키워드의 검색 횟수를 산정한 결과이다

포인트는 네이버의 실시간 인기 검색어를 30초 간격으로 수집하여 각 키워

드를 순위별로 부여한 점수를 의미한다 결과적으로 하루 동안 누적된 포인

트를 합산하여 랭크를 매겨 하루의 검색 정보를 순위화 한다[25]

100개의 키워드가 130000000번 검색될 때 상위 10개의 키워드는

73642358번 검색된다 즉 10위 내 키워드를 입력할 확률은 5664로 입력되

는 100개의 키워드 중 절반 이상을 차지한다 또한 검색 서비스를 이용하는

빈도에 따라 사용자를 두 단계로 구분하였다 Light user는 하루 평균 10883회

의 키워드를 입력하고 heavy user는 light user의 10배인 10833회의 키워드를

입력한다고 가정하였다 트래픽 사용이 많은 heavy user라도 70위 이상의 키

워드를 한 번이라도 검색할 확률은 20 미만이다 따라서 100위 밖의 키워

드는 검색 빈도가 낮다고 고려하고 검색 확률을 제외한다면 11위부터 100위

까지의 키워드를 입력할 확률은 4336가 된다

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 41: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

31

표 5 100 위 내 키워드 검색 건수

Table 5 Keyword search result number ranked 100

평균 포인트(p) 하루 검색 횟수(회) Light user

하루 검색건수(건) Heavy user

하루 검색건수(건)

1 2708471 21863398 182 1822

2 1204964 9726746 081 811

3 963071 7774132 065 648

4 860443 6945691 058 579

5 719950 5811600 048 484

6 646421 5218061 043 435

7 579079 4674454 039 39

8 528343 4264904 036 355

9 481000 3882742 032 324

10 431186 3480629 029 290

11 391386 3159355 026 263

12 351679 2838830 024 237

13 314993 2542694 021 212

20 195064 1574603 013 131

21 181114 1461996 012 122

30 106914 863036 007 072

31 98536 826365 007 069

50 51736 471622 003 035

51 50021 403784 003 034

80 21850 176378 001 015

81 21257 171592 001 014

99 14157 114280 001 010

100 13807 111454 001 009

총합 130000000 1083 10833

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 42: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

32

제 2 항 캐시 설계

제안하는 알고리즘에서는 소형셀 캐시의 최대 저장 가능 용량을 웹 브

라우저에서 사용하는 캐시 사이즈를 적용하였다 최소의 용량으로 최대의 효

과를 내기 위해서 일반적으로 사용하는 한 사람의 웹 브라우저 캐시 사이즈

를 이용하고자 한다

글로벌 웹 시장통계사이트 StatCounter의 결과에 따르면 2013년 10월부터

2014년 10월까지 전세계 웹 브라우저 시장 점유율은 그림 10과 같다

StatCounter는 페이지 뷰를 기준으로 점유율을 집계한 결과로서 특정 웹 브라

우저가 인터넷 상에서 얼마나 큰 비중을 차지하고 있는지 나타내고 있다 그

결과는 Chrome 4444 IE 2263 Firefox 1823 Safari 989 Opera 133 기

타 351로 나타난다 가장 많이 사용되는 상위 세 가지 웹 브라우저는 전체

웹 사용자 중 853를 차지한다[26]

그림 10 웹 브라우저 별 시장 점유율

Fig 10 Market share of web browsers

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 43: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

33

표 6 웹 브라우저 별 캐시 사이즈

Table 6 Cache size of web browsers

웹 브라우저 종류 브라우저 버전 캐시 사이즈

Chrome Version 12 85MB

IE IE 9 150MB

Firefox Firefox 50 75MB

표 6는 시장 점유율이 가장 높은 상위 세 가지 웹 브라우저의 일반적인

캐시 사이즈를 나타낸다[27] 제안하는 알고리즘에서는 Chrome IE Firefox의

평균 캐시 사이즈 값인 103Mbytes를 사용하였다 제한된 캐시 사이즈 내에서

서로 다른 특징을 가진 세 종류의 검색어가 모두 저장되기 위해서는 각각

최대 캐시 저장 가능 사이즈를 분배해야 된다 제안하는 알고리즘에서는 파

일크기를 이용하여 할당 비율을 정하고자 한다

사용자가 웹 브라우저를 이용하는 경우 일반적으로 트래픽을 사용하는

수준에 따라 웹 페이지 오디오 스트리밍 비디오 스트리밍 세 단계로 나누

는 방식을 많이 사용한다 그러나 실제 웹 브라우저를 이용하는 빈도는 오디

오 스트리밍과 비디오 스트리밍을 이용하는 횟수보다 많을 것으로 예상된다

따라서 제안하는 알고리즘에서는 웹 페이지의 트래픽 사용 수준을 고려하여

세부적인 세 가지 레벨로 분류하였다 다수의 이미지와 다수의 검색을 통해

많은 트래픽이 요구되는 경우는 단일성 검색의 3배의 파일 크기를 적용하였

다 트래픽을 분석한 결과 다회성 검색 이상의 트래픽을 요구하는 경우는 보

통 웹툰 혹은 웹툰과 동급 수준의 트래픽을 사용하는 경우가 많아 웹 페이

지의 가장 높은 수준으로 웹툰을 적용하였다 통신사에서 제공하는 평균 어

플리케이션 별 실제 트래픽 사용량을 기준으로 서비스 별 파일 크기를 지정

하였다[28]

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 44: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

34

표 7 웹 서비스 별 파일 크기

Table 7 File size of web services

사이즈 점수 웹 서비스의 종류 파일크기

1 1회성 검색 단순 기사 500Kbytes

2 다회성 검색 여러 개의 이미지 1500Kbytes

3 웹툰 4Mbytes

4 오디오 스트리밍 5Mbytes

5 비디오 스트리밍 6Mbytes

6 다운로드 30Mbytes

표 8 실제 적용 예시

Table 8 Actual application example

순위 대학생 인기 검색어 순위 사이즈 점수

1 풋볼데이 3

2 네이버 웹툰 3

3 멜론차트 4

4 아이폰 6 플러스 2

5 어메이징 스파이더맨 3 5

6 갤럭시 노트 4 2

7 어벤져스 2 등장인물 2

8 던전 앤 파이터 3

9 에픽하이 born hater 4

10 전역일 계산기 1

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 45: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

35

표 8은 실제 10월 23일 20시 대학생 인기 검색어 순위를 표 7의 기준에

따라 파일 사이즈 점수를 부여한 것이다 이때 최대한 그날의 이슈를 이해

하고 반영하고자 노력하였고 또한 각 사용자의 입장에서 각 검색어가 지니

는 특징을 고려하여 점수를 환산하였다 예를 들어 검색 순위 8위인 lsquo던전

앤 파이터rsquo를 검색하는 대학생은 게임의 공략과 정보를 얻기 위해 블로그나

카페를 방문할 확률이 높다 이때 많은 게임 사진과 짧은 동영상을 감상할

것이며 동일한 같은 과정을 여러 블로그나 카페의 게시물을 통해 반복할 확

률이 높다고 판단하였다 이를 고려하여 웹툰 수준의 데이터를 사용하는 3

점을 부여하였다 검색 순위 9위에 랭크 된 lsquo에픽하이 born haterrsquo는 가수 에

픽하이의 정규 앨범이 발매됨에 따라 스트리밍 음악 듣기를 할 확률이 높다

고 판단하고 4점의 점수를 부여하였다

표 9 검색어 별 파일 크기

Table 9 File size of keyword

종류 점수 파일 크기 캐시 내 크기

실시간 인기 검색어 1508 112296Kbytes 2179Mbytes

대학교 인기 검색어 2386 270093Kbytes 5241Mbytes

영통구 인기 검색어 1969 148401Kbytes 2880Mbytes

합 계 5863 530790Kbytes 103Mbytes

표 9는 2014년 10월 23일부터 11월 5일까지 수집한 검색어를 파일 크기

점수로 환산한 결과이다 대학교 인기 검색어가 가장 높은 점수를 나타내는

반면 실시간 인기 검색어는 가장 낮은 환산 점수가 도출되었다 이 점수에

비례하여 캐시 내 사이즈 할당 결과 상대적으로 파일 크기가 큰 대학교 인

기 검색어는 5241Mbytes의 캐시 저장 공간을 차지하게 되었다 할당된 캐시

공간을 파일 크기로 나눈 값인 20은 관련 페이지를 저장할 수 있는 최대 키

워드 슬롯 개수에 해당한다

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 46: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

36

제 2 절 소형셀 Cache efficiency 모델링

제안하는 local caching 알고리즘을 사용하였을 경우 기존 대비 코어망

트래픽이 얼마나 감소하였는지 효율 검증을 위한 모델링은 그림 11과 같다

전체 발생하는 트래픽에서 캐시에 저장하기 위해 사용되는 트래픽과 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽의 양을 제거한다 이를 통

해 제안하는 알고리즘을 적용하였을 경우 발생하는 캐시 효용성을 나타낼

수 있다 Save cache traffic은 캐시에 저장하기 위해 사용되는 트래픽으로 최초

할당된 캐시 저장 공간을 채우는 트래픽과 캐시 교체 알고리즘을 통해 주기

적으로 교체되는 키워드에 대한 트래픽에 해당된다 Off cache traffic은 캐시

되지 않은 키워드가 요청될 시 발생하는 트래픽으로 순위 내에 존재하지만

캐시에 저장되어 있지 않은 키워드와 순위 내에 존재하지 않은 키워드로부

터 발생하는 트래픽으로 구분 될 수 있다

그림 11 소형셀 캐시 효용성 모델링

Fig 11 Modeling of smallcell cache efficiency

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 47: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

37

표 10 알고리즘 효용성 검증 변수

Table 10 Verification parameter of algorithm efficiency

Parameter Value

cacheEff 캐시 효용성

totalT 발생되는 전체 트래픽

_cachesaveT 캐시에 저장하기 위해 사용되는 트래픽

off_cacheT 캐시 미스로 발생되는 트래픽

i 1위부터 100위까지 순위

t 9시부터 22시까지 시간

X a b c a =실시간 b =타겟 별 c =지역 별

iN 검색어 검색 횟수

i t XL 파일 크기

tXU 캐시에 저장된 키워드 중 교체 되는 키워드 함수

tXC 캐시 용량

X tH 캐시 적중률

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 48: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

38

그림 11의 소형셀 캐시 효용성 모델링을 표 10에 기반하여 수식으로 나

타내면 다음과 같다

_ _( )100()

total save cache off cache

cachetotal

T T TEff

T

(1)

수식 1은 제안하는 local caching 알고리즘을 적용하지 않았을 때와 비교하여

코어망 오프로딩을 통한 캐시 효율을 나타내며 세 가지 구성 요소로 이루어

져있다

22 100tX9 1total iit i NT L (2)

수식 2는 성능 분석 기간 동안 발생하는 전체 트래픽을 나타낸다 사용자로

부터 100가지 키워드가 검색된다고 가정할 때 요청되는 전체 페이지의 트래

픽 양을 계산한다

( )Xi tsave X tt C Tt C F (3)

100_ tX tX19 ( 122])save

save cache i iX t saveitt y U tT L L (4)

수식 4는 키워드가 캐시에 저장되기 위해 사용되는 트래픽 양으로 초기 단

계와 유지단계로 나뉜다 초기단계는 할당된 캐시 용량까지 캐시를 채우는

과정에

해당한다 유지단계는 한 시간 간격으로 저장된 캐시와 새로운 키워드를 비

교하여 캐시를 업데이트하면서 추가로 키워드를 저장하는 단계이다

X

0

1tU

no change

replacement (5)

수식 5는 유지단계에서 한 시간 전 캐시와 비교하여 바뀐 내용을 나타내는

함수이다 이를 통해 변경된 키워드에 대한 트래픽을 계산한다 U119883119905 함수가

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 49: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

39

0인 상태는 캐시 내용이 변하지 않아 유지되는 경우이다 반면에 U119883119905 함수

가 1인 상태는 한 시간 전의 캐시 내용과 비교했을 때 새로운 키워드가 생

성되어 해당 페이지 캐시 업데이트가 필요한 경우에 해당된다

24 100 24 10_ tX tX9 11 9 1(1 )off cache i X t iit i t iNT L H L (6)

수식 6은 캐시 되지 않은 키워드가 요청되어 발생하는 트래픽 양을 나타낸

다 일반적으로 cache miss라고 부르는 경우에 해당된다 제안하는 알고리즘

에서는 두 가지 형태의 cache miss가 발생할 수 있다 먼저 캐시의 대상에서

제외되었던 11위부터 100위까지의 키워드가 검색되었을 경우 해당 페이지는

코어망으로부터 페이지를 요청해야 한다 그리고 1위부터 10위 내의 키워드

가 검색되더라도 캐시에 저장되어 있지 않은 경우에는 코어망으로부터 트래

픽을 수신해야 한다

이러한 과정을 실시간 인기 검색어 대학교 인기 검색어 영통구 인기

검색어에서 반복하게 된다

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 50: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

40

제 3 절 시뮬레이션을 이용한 검증

제안하는 소형셀 local caching 알고리즘의 성능을 분석하기 위한 시뮬레

이션 환경은 표 11과 같다

표 11 시뮬레이션 환경

Table 11 Simulation environment

Parameter Setting

Type of smallcell Home enterprise smallcell

Number of smallcell 1

Number of users 20 peoples

Cache size 103 Mbytes

Replacement policy LRU

Replacement duration 1hour

Size of keyword

실시간 인기 검색어(A) 112296 Kbytes

대학생 인기 검색어(B) 270093 Kbytes

영통구 인기 검색어(C) 148401 Kbytes

Probability to search keyword

1 위부터 10 위 내 검색어 5664

11 위부터 100 위 내 검색어 4336

101 위 이상의 검색어 0

Generation traffic per person Light user 1083 times

Heavy user 10833 times

Traffic Scenario(TS) TS 1 light user 5 users heavy user 15 users

TS 2 light user 15 users heavy user 5 users

Keyword Scenario(KS)

KS 1 A 333 B 333 C 333

KS 2 A 60 B 20 C 20

KS 3 A 20 B 60 C 20

KS 4 A 20 B 20 C 60

KS 5 A 50 B 25 C 25

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 51: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

41

그림 12 트래픽 별 크기 비율(TS=1 KS=1)

Fig 12 Ratio of traffic(TS=1 KS=1)

그림 12는 TS (Traffic Scenario) 1에서 각 시간대 트래픽 비율을 나타낸다

TS는 표 5에서 정의한 light user와 heavy user의 비율을 조절하여 두 단계로

분류하였다 TS 1은 TS 2 보다 heavy user가 많기 때문에 트래픽이 약 24배 더

많이 발생된다 그림 12는 전체 트래픽 중에 캐시에 저장하기 위해 사용되

는 119879119904119886119907119890_119888119886119888ℎ119890 와 캐시에 저장되지 않은 키워드가 요청되는 경우 발생하는

119879119900119891119891_119888119886119888ℎ119890 의 비율을 보여준다 발생하는 전체 트래픽 중 119879119904119886119907119890_119888119886119888ℎ119890 와

119879119900119891119891_119888119886119888ℎ119890를 제거한 119879119888119886119888ℎ119890_119890119891119891119894119888119894119890119899119888119910는 10시에 가장 적고 12시 이후에는 일정

수준 이상을 유지하게 된다 초기 단계인 9시부터 10시는 비어있는 초기 캐

시 용량을 채우기 위한 트래픽과 캐시 미스로 인해 코어망을 이용하는 트래

픽이 많이 발생하게 된다 이러한 경우 트래픽 발생량이 적다면 오전 10시

에는 캐시 효율이 나오지 않을 수도 있다

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 52: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

42

그림 13 검색어 별 시간에 따른 캐시 저장용량(TS=1)

Fig 13 Cache storage capacity per keyword(TS=1)

그림 13은 초기 캐시가 비어 있는 상태에서 시간의 흐름에 따라 캐시에

저장된 트래픽 용량을 나타낸다 표 9의 결과에 의하면 저장 가능한 전체

캐시 크기는 103 Mbytes이고 이 중 대학생 인기 검색어는 5241 Mbytes를 차

지한다 실시간 인기 검색어와 영통구 인기 검색어는 각 2179 Mbytes 2880

Mbytes로 할당된다 9시에서 12시 사이는 캐시를 채우는 단계가 되고 그 이

후는 캐시 교체 알고리즘에 의해 유지되는 단계이다 실시간 검색어는 초기

단계가 가장 길어 15시에 할당된 캐시 저장용량을 모두 채우게 된다 상대

적으로 나머지 두 가지 검색어에 비해 키워드 변화가 적어 캐시가 가득 채

워지는 시간이 오래 걸린다

10 12 14 16 18 20 220

10

20

30

40

50

60

70cach

e c

ap

acit

y (

MB

yte

s)

time (o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 53: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

43

그림 14 검색어 별 시간에 따른 누적 캐시 효용성(TS=1 KS=1)

Fig 14 Accumulated cache efficiency per keyword(TS=1 KS=1)

그림 14는 사용자가 요청한 트래픽이 캐시를 통해 전달되는 캐시 효용

성이 시간에 따라 누적된 양을 보여준다 상대적으로 트래픽 발생량이 많아

캐시 저장용량을 더 많이 가지고 있는 대학생 인기 검색어의 캐시 효용성이

다른 검색어의 캐시 효용성보다 약 2배 정도 좋게 나타났다 영통구 검색어

가 실시간 검색어보다 더 많은 캐시 저장용량을 가지고 있지만 13시 이전까

지는 누적 캐시 효용성이 거의 동일하게 증가한다 영통구 검색어는 지역적

특성상 9시와 10시에 출근 관련 검색어가 많이 등장한다 하지만 이 검색어

들은 11시와 12시에 다시 등장하지 않아 낮은 캐시 적중률을 초래하며 결과

적으로 캐시 효용성에 영향을 미친다

10 11 12 13 14 15 16 17 18 19 20 210

50

100

150

200

250

300

350

400

450

500

cach

e e

ffic

ien

cy

(MB

yte

s)

time(o clock)

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 54: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

44

그림 15 검색어 별 날짜에 따른 캐시 적중률(TS=1)

Fig 15 Cache hit ratio per keyword(TS=1)

그림 15는 수집 기간 동안 하루 평균 캐시 적중률을 나타낸다 실시간

인기 검색어가 평균 614로 가장 높았고 대학생 검색어가 519 영통구

인기 검색어가 496로 가장 낮았다 대학생 인기 검색어의 캐시 적중률 표

준편차가 10으로 가장 높게 나타나고 영통구 인기 검색어가 59로 가장 낮

게 나타났다 실시간 인기 검색어의 키워드 내용은 당일의 이슈에 따라 달

라지는 경우에 많은 반면 영통구 인기 검색어는 매일 비슷한 패턴을 유지했

다 세 가지 검색어는 하루 평균 543의 적중률을 보였으며 최소 482에

서 최대 616까지 나타났다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

실시간 인기 검색어

대학생 인기 검색어

영통구 인기 검색어

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 55: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

45

그림 16 날짜에 따른 캐시 적중률 비교(TS=1 KS=1)

Fig 16 Cache hit ratio per algorithm(TS=1 KS=1)

그림 16은 제안하는 local caching 알고리즘과 FIFO 방식의 하루 평균 캐

시 적중률을 나타낸다 두 가지 방식에서 최대 캐시 저장 가능 용량은 동일

하게 할당 하였다 검색어는 급변하는 것이 아니라 일정 흐름을 유지하는

변수이기 때문에 FIFO 방식 보다 LRU를 기반으로 한 local caching 알고리즘

의 캐시 적중률이 더 높게 나왔다 이러한 결과는 소형셀 사용자들이 유사

한 성향을 가지고 있어 저장된 캐시를 다시 사용할 확률이 높음을 의미한다

2 4 6 8 10 12 140

10

20

30

40

50

60

70

80

90

100h

it r

ati

o (

)

day

Proposed algorithmFIFO

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 56: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

46

그림 17 트래픽 시나리오 별 시간에 따른 캐시 효용성(TS=12 KS=1)

Fig 17 Cache efficiency per traffic scenario(TS=12 KS=1)

그림 17은 트래픽 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

두 가지 시나리오 모두 10시의 캐시 효율은 낮지만 11시 이후에는 일정 효

율 이상을 유지하게 된다 TS 1은 키워드 검색 횟수와 요청 트래픽이 많아

평균 24의 효율을 보인다 반면 TS 2는 light user가 많아 요청 트래픽 발생

량이 적고 평균 16의 효율을 보인다 특히 캐시 효용성을 처음 확인할 수

있는 10시의 경우 TS 1는 85의 효율이 나타나지만 TS 2에서는 효율이 나

타나지 않는다 초기 단계부터 캐시 효율을 원한다면 heavy user가 많은 소규

모 집단이나 다수가 이용하여 많은 트래픽이 발생하는 소형셀에 알고리즘을

적용해야 함을 의미한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40

45

50cach

e e

ffic

ien

cy

(

)

time (o clock)

TS 1 light user 5명 heavy user 15명

TS 2 light user 15명 heavy user 5명

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 57: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

47

그림 18 키워드 시나리오 별 시간에 따른 캐시 효용성(TS=1 KS=234)

Fig 18 Cache efficiency per scenario(TS=1 KS=234)

그림 18은 키워드 시나리오 별 시간에 따른 캐시 효용성을 나타낸다

실시간 인기 검색어가 높은 경우 대학생 인기 검색어가 높은 경우 영통구

인기 검색어가 높은 경우의 세 가지 시나리오를 전제하였다 실시간 인기

검색어가 높은 시나리오에서 약간 더 좋은 캐시 효용성을 갖지만 대체적으

로 세 가지 시나리오에서 큰 차이가 없다 다만 오전 10시에서 KS 3과 KS 4

의 경우 캐시를 채우기 위해 발생하는 트래픽과 캐시 미스에 의한 트래픽에

의해 효용성이 현저히 낮아 음수 값이 발생함을 확인할 수 있다 11시 이후

에는 모든 시나리오에서 일정 수준 이상의 캐시 효용성을 보여주며 시간에

따라 가감은 생기지만 약 20 ~ 30 이내의 효율을 유지한다

10 11 12 13 14 15 16 17 18 19 20 210

5

10

15

20

25

30

35

40accu

mu

lati

ve c

ach

e e

ffic

ien

cy

(

)

time (o clock)

KS 2 (a=06 b=02 c=02)KS 3 (a=02 b=06 c=02)KS 4 (a=02 b=02 c=06)

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 58: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

48

그림 19 방식 별 시간에 따른 캐시 효용성(TS=1 KS=15)

Fig 19 Cache efficiency per algorithm(TS=1 KS=15)

그림 19는 제안하는 local caching 알고리즘을 적용한 방식 기존의 웹 캐

시방식 캐시를 사용하지 않은 방식에서 시간에 따른 캐시 효용성을 보여

준다 실시간 인기 검색어의 비율이 달라지는 두 가지 시나리오 환경을 전

제하였다 알고리즘을 적용할 경우 시나리오에 따른 캐시 효용성에 큰 변

화가 없다 반면 알고리즘을 적용하지 않은 기존의 웹 캐시 방식의 경우

소형셀 특성이 반영되지 않은 실시간 인기 검색어만 의존해 결과가 도출

되기 때문에 실시간 인기 검색어의 비율이 큰 KS 5에서 더 좋은 효율이

나타난다 캐시를 사용하지 않는 경우는 효율이 없다 제안하는 알고리즘

을 적용하면 작은 캐시 용량에도 충분히 캐시 적중률을 높이고 코어망의

트래픽을 줄일 수 있는 알고리즘의 효용성을 검증하였다

10 11 12 13 14 15 16 17 18 19 20 21

0

5

10

15

20

25

30

35

40

45

50ca

ch

e e

ffic

ien

cy

(

)

time (o clock)

Proposed algorithm(KS 1)Proposed algorithm(KS 5)Conventional algorithm(KS 1)Conventional algorithm(KS 5)Without cache

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 59: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

49

그림 20 시나리오 별 트래픽에 따른 캐시 효용성(KS=23)

Fig 20 Cache efficiency per scenario(KS=23)

그림 20은 제안하는 알고리즘을 적용한 경우와 기존의 웹 캐시 방식에

서 트래픽 증가에 따른 캐시 효용성을 보여준다 알고리즘을 적용하였을 때

트래픽 발생량이 500Kbytes 미만인 경우 현저히 낮은 효율을 보이지만 650

Kbytes에서 캐시 효용성이 20를 넘어선다 이후 발생 트래픽이 증가함에

따라 캐시 효용성이 30에 수렴하게 된다 같은 조건에서 웹 캐시 방식은

제안하는 알고리즘의 절반 수준인 약 15의 효율을 갖게 된다 특히 트래픽

발생량이 낮을 경우 효율이 현저히 떨어지게 되며 KS 3 기반에서는 5의

효율도 달성하지 못한다 본 논문에서 제안하는 알고리즘은 사용자가 일정

이상의 트래픽이 발생하는 소형셀에 적용하였을 경우 최대의 효율이 발생됨

을 확인하였다

500 1000 1500 2000 2500 3000 3500 4000 4500 5000-20

-10

0

10

20

30

40

50ca

ch

e e

ffic

ien

cy

(

)

traffic (Kbytes)

Proposed algorithm(KS 2)Proposed algorithm(KS 3)Conventional algorithm(KS 2)Conventional algorithm(KS 3)

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 60: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

50

제 5 장 결론

본 논문에서는 LTE 시스템에서 소형셀 사용자의 특성을 반영한 local

caching 알고리즘을 제안하였다 먼저 소형셀 캐시가 적용될 경우 예상되는

LTE 네트워크 구조를 도출하였고 알고리즘을 단계 별로 제안하였다

제안하는 알고리즘은 homeenterprise 소형셀 사용자의 특성을 활용하는

데 초점을 맞췄다 Homeenterprise 소형셀 사용자들은 대부분 동일한 그룹으

로 서로간의 성향 유사도가 높고 물리적인 거리도 가까워 비슷한 트래픽을

이용하는 것을 확인하였고 이를 알고리즘에 반영하였다 또한 소형셀의 캐

시 저장용량으로 최대의 효율을 만들기 위해 파일 크기를 고려하여 용량을

할당하였다 이는 최근 제안되는 소형셀 캐시 알고리즘이 전통적인 웹 캐시

방식에서 크게 탈피하지 못한 단점에서 벗어나 소형셀의 특성을 충분히 반

영하였다고 볼 수 있다

제안하는 알고리즘을 통해 기존 웹 캐시 교체 알고리즘인 FIFO와 비교

하여 캐시 적중률이 개선되었음을 확인하였다 또한 캐시 효용성 모델링을

통해 코어망의 트래픽이 감소하여 성능이 개선된 것을 검증하였다 성능 분

석 결과 제안된 알고리즘을 사용할 경우 기존의 웹 캐시 방식에 비해 200

의 효율을 가져옴을 확인하였다

본 연구에서 제안하는 local caching 알고리즘은 일반적인 가정이나 사무

실 교실 등 일정 수준 이상의 트래픽이 발생하고 캐시 기능을 보유한 소형

셀에 탑재될 수 있다 특히 사용자의 유사도가 높은 집단일수록 코어망으로

부터 가져오는 트래픽 양을 줄여 성능이 큰 폭으로 개선될 것으로 예상한다

결과적으로 향후 폭발적으로 증대될 트래픽으로 인한 네트워크 부하를 감소

시킬 것으로 기대된다

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 61: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

51

참고 문헌

[1] 미래창조과학부 통신정책국 ldquo무선통신 가입자 통계rdquo 2014년 9월

[2] 미래창조과학부 통신정책국 ldquo무선데이터 트래픽 통계rdquo 2014년 9월

[3] CISCO ldquoCisco Visual Networking Index Global Mobile Data Traffic Forecast

Update 2013ndash2018rdquo Feb 2014

[4] 이충희 김지수 김재현 B4G5G 무선통신 네트워크 전망

전자공학회논문지 제 40권 4호 pp382-392 2013년 4월

[5] Informa Telecoms amp Media ldquoSmall Cell Market Statusrdquo no 1 Feb 2013

[6] 김항석 이민호 송영근 ldquo스몰셀 시장현황 및 전망rdquo 전자통신동향분석

제 29권 제2호 2014년 4월

[7] Small Cell Forum Release Four SCF0500402 ldquoMarket status statistics Q1 2014

- Mobile Expertsrdquo June 2014

[8] C Gabriel ldquoThe role and impact of the Small Cell Forumrsquos Release Programrdquo

Wireless Infrastructure Analysts Feb 2014

[9] Small Cell Forum Release Four SCF1040401 ldquoUrban-Overviewrdquo June 2014

[10] X Wang M Chen T Taleb A Ksentini and C M Leung ldquoCache in the Air

Exploiting Content Caching and Delivery Techniques for 5G Systemsrdquo IEEE

Communication Magazine Feb 2014

[11] C Y Chang T Mcgregor and G Holmes ldquoThe LRU WWW proxy cache

document replacement algorithmrdquo Asia Pacific Web Conference 1999

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 62: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

52

[12] M Abrams C R Standridge and G Abdulla ldquoRemoval Policies in Network

Caches for World-Wide Web Objectsrdquo ACM Sigcomm Conference Press pp 293-

305 Oct 1996

[13] M F Arlitt R J Friedrich and T Y Jin ldquoPerformance evaluation of Web proxy

cache replacement policiesrdquo Tech rep HPL-98-97(R1) Hewlett-Packard

Company Palo Alto CA 1996

[14] M F Arlitt L Cherkasova J Dilley R J Friedrich and T Y Jin ldquoEvaluating

content management techniques for Web proxy cachesrdquo ACM SIGMETRICS

Performance Evaluation Review Volume 27 Issue 4 pp 3-11 March 2000

[15] P Cao and S Irani ldquoCost-aware WWW proxy caching algorithmsrdquo in Proc

Proceedings of the USENIX Symposium on Internet Technologies and Systems

pp193ndash206 1997

[16] H Bahn K Koh S H Noh and S H Lyul ldquoEfficient Replacement of Non

uniform Objects in Web Cachesrdquo Computer Volume 35 Issue 6 pp 65-73 June

2002

[17] TP Kelly Y M Chan S Jamin and J K Mackie-Mason ldquoBiased Replacement

Policies for Web Caches Differential Quality-of-Service and Aggregate User

Valuerdquo 4th Intrsquol Web Caching Workshop MarchApril 1999

[18] C Aggarwal J Wolf and P Yu ldquoCaching on the World Wide Webrdquo IEEE

Transactions on Knowledge and Data Engineering vol 11 no 1 pp 94-107

JanFeb 1999

[19] Small Cell Forum Release Four SCF0930401 ldquoExtensions of small cell zone

APIrdquo June 2014

[20] H Ahlehagh and S Dey ldquoVideo Caching in Radio Access Network Impact on

Delay and Capacityrdquo Wireless Communication And Networking Conference

April 2012

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 63: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

53

[21] E Baştuğ J L Gueacuteneacutego and M Debbah ldquoProactive Small Cell Networksrdquo

International Conference on Thermoelectrics May 2013

[22] P Blasco and D Guumlnduumlz ldquoLearning-Based Optimization of Cache Content in a

Small Cell Base Stationrdquo IEEE International Conference on Communications June

2014

[23] 네이버검색 httphelpnavercomsupportservicemainnhnserviceNo=606

[24] 네이버스토리 httpstorynavercomnaverbrandmainnhn

[25] 대한민국의 1분 httpwww1minkrmainhourlyphp

[26] 스탯카운터 httpgsstatcountercombrowser-ww-monthly-201310-201410-

bar

[27] 웹 브라우저 별 캐시 사이즈 httpwwwguypocomunderstanding-mobile-

cache-sizes

[28] SKT 데이터 사용량 httpblogsktworldcokr4706

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load

Page 64: 코어망 오프로딩을 소형셀 Local Caching - ajou.ac.krwinner.ajou.ac.kr/publication/data/theses/ms2015jsy.pdf · 2015-03-09 · 웹 브라우저 별 시장 점유율.....

54

Abstract

Due to explosive growth of capacity and requirements many techniques are

proposed as a solution in order to support a wireless demand for such a phenomenon

Most of all smallcell technology takes valuable role in wireless network as the simplest

and efficient way to solve the skyrocketing traffic The smallcell technology will be a

key component of the traffic distribution in downtown area also create new services to

customers in the future

In particular when we use cache storage inside smallcell it can reduce the traffic

toward core network and the network cost but increase itsrsquo performance Also we can

pre-cache files while backhaul link is not busy so that it can reduce the backhaul traffic

link load In this paper we propose a smallcell local caching algorithm using userrsquos

context for core network offloading in smallcell environment

In general users camped on the same smallcell have a similar traffic tendencies or

same goals Users accessing a neighboring smallcell have a high traffic use similarities

The proposed algorithm focuses on smallcell characteristics and userrsquos personality

compared to existing web cache algorithm Therefore the elements of proposed algorithm

reflect a geographical distribution characteristics and a user group categoryrsquos personality

Moreover it allocates the appropriate cached memory for each user group in the limited

storage capacity to improve hit ratio

In order to evaluate the performance of the proposed cache algorithm we collected

the keywords from the largest commercial portal site and adapted real data which

includes real cache sizes traffic and users for simulation environment

In order to evaluate the performance of the proposed cache algorithm we define the

cache efficiency the decrement of core network traffic The simulation results show that

the proposed algorithm can improve performance by about 200 compared to existing

web cache scheme The proposed algorithm is a more efficient way of using limited cache

capacity and makes better hit ratio than the conventional web cache algorithm The

proposed algorithm will be loaded on the smallcell that has an ability to save traffic at

their cache and reduce an explosive growth of network load