새벽코딩

[프로그래머스] KAKAO BLIND [1차] 캐시 (JAVA) 본문

알고리즘

[프로그래머스] KAKAO BLIND [1차] 캐시 (JAVA)

J 코딩 2024. 1. 31. 16:54
반응형

https://school.programmers.co.kr/learn/courses/30/lessons/17680

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr


캐시

지도개발팀에서 근무하는 제이지는 지도에서 도시 이름을 검색하면 해당 도시와 관련된 맛집 게시물들을 데이터베이스에서 읽어 보여주는 서비스를 개발하고 있다.
이 프로그램의 테스팅 업무를 담당하고 있는 어피치는 서비스를 오픈하기 전 각 로직에 대한 성능 측정을 수행하였는데, 제이지가 작성한 부분 중 데이터베이스에서 게시물을 가져오는 부분의 실행시간이 너무 오래 걸린다는 것을 알게 되었다.
어피치는 제이지에게 해당 로직을 개선하라고 닦달하기 시작하였고, 제이지는 DB 캐시를 적용하여 성능 개선을 시도하고 있지만 캐시 크기를 얼마로 해야 효율적인지 몰라 난감한 상황이다.

어피치에게 시달리는 제이지를 도와, DB 캐시를 적용할 때 캐시 크기에 따른 실행시간 측정 프로그램을 작성하시오.

입력 형식

  • 캐시 크기(cacheSize)와 도시이름 배열(cities)을 입력받는다.
  • cacheSize는 정수이며, 범위는 0 ≦ cacheSize ≦ 30 이다.
  • cities는 도시 이름으로 이뤄진 문자열 배열로, 최대 도시 수는 100,000개이다.
  • 각 도시 이름은 공백, 숫자, 특수문자 등이 없는 영문자로 구성되며, 대소문자 구분을 하지 않는다. 도시 이름은 최대 20자로 이루어져 있다.

출력 형식

  • 입력된 도시이름 배열을 순서대로 처리할 때, "총 실행시간"을 출력한다.

조건

  • 캐시 교체 알고리즘은 LRU(Least Recently Used)를 사용한다.
  • cache hit일 경우 실행시간은 1이다.
  • cache miss일 경우 실행시간은 5이다.

※  JAVA 코드 (캐시)

import java.util.*;

class Solution {
    public int solution(int cacheSize, String[] cities) {
        int answer = 0;
        LinkedHashSet<String> memory = new LinkedHashSet<>();

        for(int i = 0; i < cities.length; i++) {
            String city = cities[i].toLowerCase();
            // 캐시에 존재하지 않은 데이터가 들어올때
            if(!memory.contains(city)) {
                if(cacheSize > 0) {
                    // 메모리가 꽉찼다면
                    if(memory.size() >= cacheSize) {
                        // 가장 첫데이터를 제거한다
                        String oldData = memory.stream().findFirst().orElse(null);
                        memory.remove(oldData);
                        memory.add(city);
                    } else {
                        memory.add(city);
                    }
                }
                
                answer += 5; // 5초증가
            } else { // 캐시에 이미 존재하는 데이터일 경우
                // 들어온 순서 갱신
                memory.remove(city);
                memory.add(city);
                answer++; // 1초증가
            }
        }

        return answer;
    }
}

※ 생각정리 (캐시)

아마 캐시의 동작원리는 다들 알고 있을 것이다. 최근 Redis 캐시를 사용해 시스템을 최적화 한 글을 쓴적이 있는데 캐시는 실제 프로그램에서 매우 자주 사용하는 것중 하나이다.

실제로 우리의 주 메모리에 비해 캐시메모리의 접근 속도는 상상이상으로 빠르다.. 물론 운영체제, 시스템 구조, 접근 로직, 데이터 저장 방식 등 다양한 요소들에 따라 달라질 수 있기때문에 여러 점을 고려하여 캐시메모리를 사용할지 결정해야한다.

캐시메모리는 Hit latency(캐시에 데이터가 존재했을때), Miss lantency(캐시에 데이터가 존재하지 않았을때) 두 접근율로 접근 속도를 결정할 수 있다. 실제로는 Hit latency + (Miss Latency x Miss rate)의 식으로 평균 접근 속도를 구할 수 있다.

다음으로 LRU 알고리즘에 대해서 어디선가 들어봤을 수도 있다. 학부시절 운영체제 과목에서 CPU가 페이징 처리를 할때 메모리에 접근하는 방식에 대해서 여러가지 알고리즘을 배워보았다. 그 중 기억나는 몇가지 알고리즘이 있다.

FIFO(First In First Out), LRU(Least Recently Used), LFU(Least Frequently Used) 세개의 알고리즘에 대해 간단히 되집어보고 가자

 

1. FIFO(First In First Out)

우리에게 가장 낯익은 알고리즘이다 Queue 알고리즘의 로직과 동일하며 LRU와의 차이점은 메모리가 꽉찼을때 단순히 메모리에 적재된지 가장 오래된 데이터 순으로 교체가 일어난다.

 

2. LRU(Least Recently Used)

문제에서 언급된 알고리즘으로 가장 최근에 사용되어지지 않은 데이터 순으로 교체가 일어난다.

 

3. LFU(Least Frequently Used)

이 알고리즘도 꽤 재미있는 로직을 가지고 있다. 각 데이터 마다 사용횟수가 매겨지며 모리가 꽉찼을때  다음 메모리 접근시 사용횟수가 가장 적었던 데이터 순으로 교체가 일어난다.

 

[문제 풀이]

문제에서는 순서를 보장해주기위해 LinkedHashSet<>()을 이용했다. 각 도시의 이름을 적재하면서 캐시메모리를 초과하는 경우 가장 처음 적재되었던 데이터순으로 삭제를 해주었는데 이때 최근에 사용한 데이터는 제외하기위해서 최근 데이터가 재 방문될때 삭제후 다시 셋에 담아서 최신 데이터로 만들어 주었다.

문제에 보면 대소문자를 구분하지 않는다고 하였기 때문에 모든 도시의 이름은 소문자로 변경하여 메모리에 적재하였다.

캐시메모리 사이즈가 0일 수 있는 경우를 생각해야한다. 캐시메모리가 0인경우에는 셋에 담지않고 계속해서 Miss일때의 사용시간을 증가시킨다.

 

감사합니다.

-Jace Park-

반응형
Comments