라떼는말이야
[프로그래머스 lv2] 튜플 (파이썬) 본문
2019 카카오 개발자 겨울 인턴십 문제입니다.
문제 설명
셀수있는 수량의 순서있는 열거 또는 어떤 순서를 따르는 요소들의 모음을 튜플(tuple)이라고 합니다. n개의 요소를 가진 튜플을 n-튜플(n-tuple)이라고 하며, 다음과 같이 표현할 수 있습니다.
- (a1, a2, a3, ..., an)
튜플은 다음과 같은 성질을 가지고 있습니다.
- 중복된 원소가 있을 수 있습니다. ex : (2, 3, 1, 2)
- 원소에 정해진 순서가 있으며, 원소의 순서가 다르면 서로 다른 튜플입니다. ex : (1, 2, 3) ≠ (1, 3, 2)
- 튜플의 원소 개수는 유한합니다.
원소의 개수가 n개이고, 중복되는 원소가 없는 튜플 (a1, a2, a3, ..., an)이 주어질 때(단, a1, a2, ..., an은 자연수), 이는 다음과 같이 집합 기호 '{', '}'를 이용해 표현할 수 있습니다.
- {{a1}, {a1, a2}, {a1, a2, a3}, {a1, a2, a3, a4}, ... {a1, a2, a3, a4, ..., an}}
예를 들어 튜플이 (2, 1, 3, 4)인 경우 이는
- {{2}, {2, 1}, {2, 1, 3}, {2, 1, 3, 4}}
와 같이 표현할 수 있습니다. 이때, 집합은 원소의 순서가 바뀌어도 상관없으므로
- {{2}, {2, 1}, {2, 1, 3}, {2, 1, 3, 4}}
- {{2, 1, 3, 4}, {2}, {2, 1, 3}, {2, 1}}
- {{1, 2, 3}, {2, 1}, {1, 2, 4, 3}, {2}}
는 모두 같은 튜플 (2, 1, 3, 4)를 나타냅니다.
특정 튜플을 표현하는 집합이 담긴 문자열 s가 매개변수로 주어질 때, s가 표현하는 튜플을 배열에 담아 return 하도록 solution 함수를 완성해주세요.
제한사항
- s의 길이는 5 이상 1,000,000 이하입니다.
- s는 숫자와 '{', '}', ',' 로만 이루어져 있습니다.
- 숫자가 0으로 시작하는 경우는 없습니다.
- s는 항상 중복되는 원소가 없는 튜플을 올바르게 표현하고 있습니다.
- s가 표현하는 튜플의 원소는 1 이상 100,000 이하인 자연수입니다.
- return 하는 배열의 길이가 1 이상 500 이하인 경우만 입력으로 주어집니다.
입출력 예
입출력 예에 대한 설명
입출력 예 #1
문제 예시와 같습니다.
입출력 예 #2
문제 예시와 같습니다.
입출력 예 #3
(111, 20)을 집합 기호를 이용해 표현하면 {{111}, {111,20}}이 되며, 이는 {{20,111},{111}}과 같습니다.
입출력 예 #4
(123)을 집합 기호를 이용해 표현하면 {{123}} 입니다.
입출력 예 #5
(3, 2, 4, 1)을 집합 기호를 이용해 표현하면 {{3},{3,2},{3,2,4},{3,2,4,1}}이 되며, 이는 {{4,2,3},{3},{2,3,4,1},{2,3}}과 같습니다.
나의 풀이
문제 이해부터 어렵다..
문제 풀이는 사실 간단하다.
주어지는 s가 여러 집합 기호로 묶여 있는데, 이 집합들을 크기(원소의 개수)가 작은 순으로 정렬한 후 작은 집합부터 값을 넣는데, 중복되지 않게 넣는 것이 해법이다.
이 과정을 수행하기 위해서는 주어지는 s를 잘 가공하고, 어떻게 정렬할 것인지 고민해야 한다.
전체 소스코드
import re
def solution(s):
answer = []
li = re.findall('\d+(?:\,\d+)*', s)
li = sorted(li, key=len)
for i in li:
for num in i.split(','):
if int(num) not in answer:
answer.append(int(num))
return answer
나는 정규식을 잘 모르지만 카카오 코딩테스트에 특히 문자열을 다루는 문제가 많이 출제되는 것 같아 기본적인 사용 방법만 익혔고, 이 문제에서도 유용하게 사용되었다.
정규표현식
\d+(?:\,\d+)*
위의 정규표현식은 뜯어보면 다음과 같다.
\d+ : 숫자 1개 이상. 즉, 1 이상의 자연수를 뜻한다.
(?: )* : 괄호 안의 식을 0회 이상 반복한다. 즉, 없어도 되고, 여러 개 있어도 되고. 그런데 안에 있는 ?: 가 있는 이유는 괄호로 묶는 것이 그루핑의 의미도 있지만 선택의 의미도 있다고 한다. 괄호의 내용을 반복하기 위한 그루핑으로 사용하기 위해서는 괄호 안에서 ?: 로 시작하면 된다.
\,\d+ : ,(콤마) 뒤에 자연수가 오는 형태이다. 그냥 콤마만 쓰면 특수한 기능을 하는 문자로 해석되기 때문에 역슬래시를 붙여주어야 콤마가 포함된 문자를 찾을 수 있다.
\d+(?:\,\d+)* : 위의 의미들을 총합해보면 123,34,12 와 같이 여러 숫자가 콤마로 나열된 부분을 찾는 식이 되겠다.
re.findall()로 찾게 되면 문자열에서 정규표현식과 일치하는 모든 부분을 리스트 형태로 반환한다.
예를 들어
"{{2},{2,1},{2,1,3},{2,1,3,4}}" |
s로 위의 문자가 들어왔다면, 위 정규식을 거치게 되면
[[2],[2,1],[2,1,3],[2,1,3,4]] 와 같은 리스트를 얻게 된다.
리스트 정렬
위 경우에는 작은 순으로 차례로 입력되었지만 그렇지 않은 경우도 있으니 정렬을 해주어야 한다.
리스트의 정렬은 sorted() 함수를 사용했다.
key로 len을 지정해주면 정렬 기준을 길이로 설정할 수 있다.
리스트 순회
이 리스트를 순회하면
- [2]
- [2,1]
- [2,1,3]
- [2,1,3,4]
순으로 내부리스트가 순회될 것이고, 각 내부리스트에서 다시 숫자를 하나씩 검사하여 answer에 중복되는지 검사한 후 중복이 되지 않는다면 answer에 차례로 넣으면 된다.
숫자를 하나씩 검사하기 위해서 split(',')을 사용했다.
그리고 입출력 예를 보면 정수형으로 return하기 때문에 int()로 감싸서 정수로 만들어준다.
'알고리즘 > 코딩 테스트' 카테고리의 다른 글
[프로그래머스 lv2] 행렬 테두리 회전하기 (파이썬) (1) | 2021.07.21 |
---|---|
[프로그래머스 lv1] 숫자 문자열과 영단어(파이썬) (0) | 2021.07.19 |
[프로그래머스 lv2] 이진 변환 반복하기 (0) | 2021.07.03 |
[프로그래머스 lv2] 위장 (파이썬) (0) | 2021.07.02 |
[프로그래머스 lv2] 더 맵게 (파이썬) (0) | 2021.06.26 |
[프로그래머스 lv1] [1차] 다트 게임 (파이썬) (0) | 2021.06.26 |
[프로그래머스 lv1] 시저 암호 (파이썬) (0) | 2021.06.25 |
[프로그래머스 lv1] 자릿수 더하기 (파이썬) (0) | 2021.06.25 |