3 minute read

❓Question

  • 카카오에 입사한 신입 개발자 네오는 “카카오계정개발팀”에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. “네오”에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.

  • 다음은 카카오 아이디의 규칙입니다.

    • 아이디의 길이는 3자 이상 15자 이하여야 합니다.
    • 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
    • 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.


✏️Example

  • 예시 1

      예를 들어, new_id 값이 "...!@BaT#*..y.abcdefghijklm" 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.
    
      1단계 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다.
      "...!@BaT#*..y.abcdefghijklm" → "...!@bat#*..y.abcdefghijklm"
    
      2단계 '!', '@', '#', '*' 문자가 제거되었습니다.
      "...!@bat#*..y.abcdefghijklm" → "...bat..y.abcdefghijklm"
    
      3단계 '...'와 '..' 가 '.'로 바뀌었습니다.
      "...bat..y.abcdefghijklm" → ".bat.y.abcdefghijklm"
    
      4단계 아이디의 처음에 위치한 '.'가 제거되었습니다.
      ".bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"
    
      5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다.
      "bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"
    
      6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
      "bat.y.abcdefghijklm" → "bat.y.abcdefghi"
    	
      7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
      "bat.y.abcdefghi" → "bat.y.abcdefghi"
    
      따라서 신규 유저가 입력한 new_id가 "...!@BaT#*..y.abcdefghijklm"일 때, 네오의 프로그램이 추천하는 새로운 아이디는 "bat.y.abcdefghi" 입니다.  
    

  • Constraints
    • 신규 유저가 입력한 아이디를 나타내는 new_id가 매개변수로 주어질 때, “네오”가 설계한 7단계의 처리 과정을 거친 후의 추천 아이디를 return 하도록 solution 함수를 완성해 주세요.
    • new_id는 길이 1 이상 1,000 이하인 문자열입니다.
    • new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
    • new_id에 나타날 수 있는 특수문자는 -_.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.

👀Intuition

  • 문자열 처리 문제로, String 내장함수를 사용해 문자열을 잘 정제하는 것이 목표.
  • 문제에서 제시하는 7단계를 그대로 구현하는 방식으로 진행한다.

    StringBuilder 사용에 대해서, 먼저 new_id의 최대 길이가 1000이고, 반복적인 += 연산은 없을 것 같음.
    String 함수 시간복잡도는 최대로 잡았을때, O(10N) 정도라고 하면, 약 10 * 1000 = 1만 번 정도의 연산 수행
    1초당 1억번의 연산을 기준으로 안정적이기 때문에 StringBuilder는 따로 사용x

👣Approach

  1. 문제에서 제시한 단계 순서를 그대로 따른다.
  2. 각 단계별로 대략 다음과 같은 내장함수를 사용한다.

    1단계: toLowerCase
    2단계: 정규식 + replaceAll
    3단계: replace(“..”, “.”) 반복
    4단계: substring으로 마침표 제거
    5단계: str += “a”
    6단계: substring, endsWith
    7단계: str += 반복

  3. 반복적으로 처리하는 부분은 while문을 사용한다.

📚Solution

  class Solution {
    public String solution(String new_id) {
        String answer = "";
        
        // 1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.
        new_id = new_id.toLowerCase();
        System.out.println(new_id);
        
        // 2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.
        new_id = new_id.replaceAll("[^a-z0-9_.-]","");
        System.out.println(new_id);
        
        // 3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
        while(new_id.indexOf("..") != -1) new_id = new_id.replace("..",".");
        System.out.println(new_id);
        
        // 4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
        if(new_id.charAt(0) == '.') new_id = new_id.substring(1);
        if(new_id.length() > 0 && new_id.charAt(new_id.length()-1) == '.') new_id = new_id.substring(0, new_id.length()-1);
        System.out.println(new_id);
            
            
        // 5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
        if(new_id.length() < 1) new_id = "a";
        System.out.println(new_id);
        
        // 6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다.
		// 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
        if(new_id.length() >= 16) {
            new_id = new_id.substring(0,15);
            if(new_id.endsWith(".")) new_id = new_id.substring(0,14);
        }
        System.out.println(new_id);
        
        
        // 7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.
        if(new_id.length() <= 2){
            while(new_id.length() < 3){
                new_id += new_id.charAt(new_id.length()-1);
            }
        }
        System.out.println(new_id);
        
        return new_id;
    }
}
  • (참고)String과 StringBuilder 성능차이 예시
    • 문자열을 반복적으로 더하는 경우, result += "a" 는 다음과 같이 동작
          StringBuilder temp = new StringBuilder(result);
          temp.append("a");
          result = temp.toString();
      

      새로운 stringBuilder 객체를 생성하고 기존 문자열을 복사하기 때문에 시간 복잡도가 O(N^2)까지 증가

    • StringBuilder 사용할 경우에는 기존 크기에서 추가 메모리 할당 없이 append만 일어나므로 O(N)

⏰Complexity

  • Time complexity:

    각 단계의 시간복잡도는 O(N)이므로 전체 코드는 O(7N) => O(N)

    단계 연산 횟수 비용
    toLowerCase() O(N) 1000번 이하
    replaceAll() 2회 각각 정규 표현식 1패스 내부적으로 C 기반 fast regex 엔진 사용
    while("..".replace) 최대 ~500번 정도지만 보통 1~3번 replace는 substring copy이지만 여전히 N 수준
    substring/charAt/endwith O(1) 또는 O(N) 무시 가능
    마지막 fill (최대 2번 append) O(1) 매우 작음
  • Space complexity:

    replaceAll, substring은 내부적으로 새로운 문자열 객체를 생성하지만 일시적이고,
    최종적으로 유지되는 공간은 new_id 하나이므로 O(N)