라떼는말이야

[프로그래머스 lv2] 튜플 (파이썬) 본문

알고리즘/코딩 테스트

[프로그래머스 lv2] 튜플 (파이썬)

MangBaam 2021. 7. 2. 04:27
반응형

2019 카카오 개발자 겨울 인턴십 문제입니다.

문제 설명

셀수있는 수량의 순서있는 열거 또는 어떤 순서를 따르는 요소들의 모음을 튜플(tuple)이라고 합니다. n개의 요소를 가진 튜플을 n-튜플(n-tuple)이라고 하며, 다음과 같이 표현할 수 있습니다.

  • (a1, a2, a3, ..., an)

튜플은 다음과 같은 성질을 가지고 있습니다.

  1. 중복된 원소가 있을 수 있습니다. ex : (2, 3, 1, 2)
  2. 원소에 정해진 순서가 있으며, 원소의 순서가 다르면 서로 다른 튜플입니다. ex : (1, 2, 3) ≠ (1, 3, 2)
  3. 튜플의 원소 개수는 유한합니다.

원소의 개수가 n개이고, 중복되는 원소가 없는 튜플 (a1, a2, a3, ..., an)이 주어질 때(단, a1, a2, ..., an은 자연수), 이는 다음과 같이 집합 기호 '{', '}'를 이용해 표현할 수 있습니다.

  • {{a1}, {a1, a2}, {a1, a2, a3}, {a1, a2, a3, a4}, ... {a1, a2, a3, a4, ..., an}}

예를 들어 튜플이 (2, 1, 3, 4)인 경우 이는

  • {{2}, {2, 1}, {2, 1, 3}, {2, 1, 3, 4}}

와 같이 표현할 수 있습니다. 이때, 집합은 원소의 순서가 바뀌어도 상관없으므로

  • {{2}, {2, 1}, {2, 1, 3}, {2, 1, 3, 4}}
  • {{2, 1, 3, 4}, {2}, {2, 1, 3}, {2, 1}}
  • {{1, 2, 3}, {2, 1}, {1, 2, 4, 3}, {2}}

는 모두 같은 튜플 (2, 1, 3, 4)를 나타냅니다.

특정 튜플을 표현하는 집합이 담긴 문자열 s가 매개변수로 주어질 때, s가 표현하는 튜플을 배열에 담아 return 하도록 solution 함수를 완성해주세요.

 

제한사항

  • s의 길이는 5 이상 1,000,000 이하입니다.
  • s는 숫자와 '{', '}', ',' 로만 이루어져 있습니다.
  • 숫자가 0으로 시작하는 경우는 없습니다.
  • s는 항상 중복되는 원소가 없는 튜플을 올바르게 표현하고 있습니다.
  • s가 표현하는 튜플의 원소는 1 이상 100,000 이하인 자연수입니다.
  • return 하는 배열의 길이가 1 이상 500 이하인 경우만 입력으로 주어집니다.

입출력 예

입출력 예

 

입출력 예에 대한 설명

입출력 예 #1

문제 예시와 같습니다.

입출력 예 #2

문제 예시와 같습니다.

입출력 예 #3

(111, 20)을 집합 기호를 이용해 표현하면 {{111}, {111,20}}이 되며, 이는 {{20,111},{111}}과 같습니다.

입출력 예 #4

(123)을 집합 기호를 이용해 표현하면 {{123}} 입니다.

입출력 예 #5

(3, 2, 4, 1)을 집합 기호를 이용해 표현하면 {{3},{3,2},{3,2,4},{3,2,4,1}}이 되며, 이는 {{4,2,3},{3},{2,3,4,1},{2,3}}과 같습니다.

 

 

 


나의 풀이

문제 이해부터 어렵다..

 

문제 풀이는 사실 간단하다.

주어지는 s가 여러 집합 기호로 묶여 있는데, 이 집합들을 크기(원소의 개수)가 작은 순으로 정렬한 후 작은 집합부터 값을 넣는데, 중복되지 않게 넣는 것이 해법이다.

 

이 과정을 수행하기 위해서는 주어지는 s를 잘 가공하고, 어떻게 정렬할 것인지 고민해야 한다.

 

전체 소스코드

import re
def solution(s):
    answer = []
    li = re.findall('\d+(?:\,\d+)*', s)
    li = sorted(li, key=len)
    for i in li:
        for num in i.split(','):
            if int(num) not in answer:
                answer.append(int(num))
    return answer

나는 정규식을 잘 모르지만 카카오 코딩테스트에 특히 문자열을 다루는 문제가 많이 출제되는 것 같아 기본적인 사용 방법만 익혔고, 이 문제에서도 유용하게 사용되었다.

 

 

 

정규표현식

\d+(?:\,\d+)*

위의 정규표현식은 뜯어보면 다음과 같다.

\d+ : 숫자 1개 이상. 즉, 1 이상의 자연수를 뜻한다.

(?: )* : 괄호 안의 식을 0회 이상 반복한다. 즉, 없어도 되고, 여러 개 있어도 되고. 그런데 안에 있는 ?: 가 있는 이유는 괄호로 묶는 것이 그루핑의 의미도 있지만 선택의 의미도 있다고 한다. 괄호의 내용을 반복하기 위한 그루핑으로 사용하기 위해서는 괄호 안에서 ?: 로 시작하면 된다.

\,\d+ : ,(콤마) 뒤에 자연수가 오는 형태이다. 그냥 콤마만 쓰면 특수한 기능을 하는 문자로 해석되기 때문에 역슬래시를 붙여주어야 콤마가 포함된 문자를 찾을 수 있다.

\d+(?:\,\d+)* : 위의 의미들을 총합해보면 123,34,12 와 같이 여러 숫자가 콤마로 나열된 부분을 찾는 식이 되겠다.

 

re.findall()로 찾게 되면 문자열에서 정규표현식과 일치하는 모든 부분을 리스트 형태로 반환한다.

예를 들어

"{{2},{2,1},{2,1,3},{2,1,3,4}}"

s로 위의 문자가 들어왔다면, 위 정규식을 거치게 되면

[[2],[2,1],[2,1,3],[2,1,3,4]] 와 같은 리스트를 얻게 된다.

 

리스트 정렬

위 경우에는 작은 순으로 차례로 입력되었지만 그렇지 않은 경우도 있으니 정렬을 해주어야 한다.

리스트의 정렬은 sorted() 함수를 사용했다.

key로 len을 지정해주면 정렬 기준을 길이로 설정할 수 있다.

 

리스트 순회

이 리스트를 순회하면

  1. [2]
  2. [2,1]
  3. [2,1,3]
  4. [2,1,3,4]

순으로 내부리스트가 순회될 것이고, 각 내부리스트에서 다시 숫자를 하나씩 검사하여 answer에 중복되는지 검사한 후 중복이 되지 않는다면 answer에 차례로 넣으면 된다.

 

숫자를 하나씩 검사하기 위해서 split(',')을 사용했다.

그리고 입출력 예를 보면 정수형으로 return하기 때문에 int()로 감싸서 정수로 만들어준다.

 

테스트 결과

 

반응형
Comments