본문 바로가기

Algorithm

[프로그래머스] 코딩테스트 연습 - 추석트래픽

코딩테스트 연습 - 추석 트래픽 [2018 KAKAO BLIND RECRUITMENT]

문제 설명

이번 추석에도 시스템 장애가 없는 명절을 보내고 싶은 어피치는 서버를 증설해야 할지 고민이다. 장애 대비용 서버 증설 여부를 결정하기 위해 작년 추석 기간인 9월 15일 로그 데이터를 분석한 후 초당 최대 처리량을 계산해보기로 했다. 초당 최대 처리량은 요청의 응답 완료 여부에 관계없이 임의 시간부터 1초(=1,000밀리 초) 간 처리하는 요청의 최대 개수를 의미한다.

 

입력 형식

  • solution 함수에 전달되는 lines 배열은 N(1 ≦ N ≦ 2,000) 개의 로그 문자열로 되어 있으며, 각 로그 문자열마다 요청에 대한 응답 완료 시간S와 처리시간 T가 공백으로 구분되어 있다.
  • 응답 완료 시간S는 작년 추석인 2016년 9월 15일만 포함하여 고정 길이 2016-09-15 hh:mm:ss.sss 형식으로 되어 있다.
  • 처리시간 T 0.1s, 0.312s, 2s 와 같이 최대 소수점 셋째 자리까지 기록하며 뒤에는 초 단위를 의미하는 s로 끝난다.
  • 예를 들어, 로그 문자열 2016-09-15 03:10:33.020 0.011s은 "2016년 9월 15일 오전 3시 10분 33.010초"부터 "2016년 9월 15일 오전 3시 10분 33.020초"까지 "0.011초" 동안 처리된 요청을 의미한다. (처리시간은 시작시간과 끝 시간을 포함)
  • 서버에는 타임아웃이 3초로 적용되어 있기 때문에 처리시간은 0.001 ≦ T ≦ 3.000이다.
  • lines 배열은 응답 완료 시간S를 기준으로 오름차순 정렬되어 있다.

출력 형식 

  • solution 함수에서는 로그 데이터 lines 배열에 대해 초당 최대 처리량을 리턴한다.

입출력 예제

 

예제 1

  • 입력: [
    "2016-09-15 01:00:04.001 2.0s",
    "2016-09-15 01:00:07.000 2s"
    ]
  • 출력: 1

예제 2

  • 입력: [
    "2016-09-15 01:00:04.002 2.0s",
    "2016-09-15 01:00:07.000 2s"
    ]
  • 출력: 2
  • 설명: 처리시간은 시작시간과 끝 시간을포함하므로
    첫 번째 로그는 01:00:02.003 ~ 01:00:04.002에서 2초 동안 처리되었으며,
    두 번째 로그는 01:00:05.001 ~ 01:00:07.000에서 2초 동안 처리된다.
    따라서, 첫 번째 로그가 끝나는 시점과 두 번째 로그가 시작하는 시점의 구간인 01:00:04.002 ~ 01:00:05.001 1초 동안 최대 2개가 된다.

예제 3

  • 입력: [
    "2016-09-15 20:59:57.421 0.351s",
    "2016-09-15 20:59:58.233 1.181s",
    "2016-09-15 20:59:58.299 0.8s",
    "2016-09-15 20:59:58.688 1.041s",
    "2016-09-15 20:59:59.591 1.412s",
    "2016-09-15 21:00:00.464 1.466s",
    "2016-09-15 21:00:00.741 1.581s",
    "2016-09-15 21:00:00.748 2.31s",
    "2016-09-15 21:00:00.966 0.381s",
    "2016-09-15 21:00:02.066 2.62s"
    ]
  • 출력: 7
  • 설명: 아래 타임라인 그림에서 빨간색으로 표시된 1초 각 구간의 처리량을 구해보면 (1)은 4개, (2)는 7개, (3)는 2개임을 알 수 있다. 따라서 초당 최대 처리량은 7이 되며, 동일한 최대 처리량을 갖는 1초 구간은 여러 개 존재할 수 있으므로 이 문제에서는 구간이 아닌 개수만 출력한다.

 

 

이미지가 참... 시간을 많이 뺏어갔다... (정확히는 내가 멍청했다ㅎ)

그림의 위에서부터 5번째 블록을 보면 블록의 시작시간과 끝 시간은 모두 (2) 범위 밖에 있다.

해당 경우가 당연히 체크될 거라 생각했다...

 

 

 

 

 

Code

def solution(lines):
    answer = 0
    history = []
    for line in lines:
        temp = line.split(" ")[1:]
        time = temp[0].split(":")
        end = int(time[0]) * 60 * 60 * 1000 + int(time[1]) * 60 * 1000 + float(time[2]) * 1000
        start = 1 + end - float(temp[1].replace('s', '')) * 1000
        history.append([int(start), int(end)])

    def isInvolve(start):
        end = start + 1000 - 1
        count = 0
        for s, e in history:
            if e >= start and s <= end:
                count += 1
            # if (start <= s and s <= end) or (start <= e and e <= end):
            #     count += 1
        return count

    for st, et in history:
        answer = max([answer, isInvolve(st), isInvolve(et)])

    return answer

1. 시작시간과 종료시간을 모두 정수 형태로 표현하여 history에 추가한다.

2. isInvole 함수는 history를 보며 매개변수로 받은 시간을 시작시간으로 하여 범위 내에 포함되는 처리되고 있는 요청의 개수를 세어줍니다.

오른쪽과 같은 경우는 당연히 포함시키지 못할 텐데 주석으로 처리한 if문을 사용해서 한참 헤맸습니다... (예시들은 물론 테스트 케이스 2,3,18 빼고 모두 통과했어서 초계산에서 틀린 줄 알고 한참 찾았거든요..ㅎㅎ) 

3. history에 모든 숫자를 isInvolve함수에 넣어 가장 큰 값을 반환합니다.

 

부족한 점이 많은 글이지만 봐주셔서 감사합니다. :)

잘못된 점이 있다면 댓글 남겨주시면 감사하겠습니다. :)