제품이 이런 대화까지 폭넓게 감당해야 한다면, 기본 응답은 자연히 더 조심스럽고 더 안정적인 쪽으로 간다.
OpenAI의 ChatGPT 릴리스 노트는 GPT-5의 기본 성격을 더 따뜻하고 친숙하게 만들고 있다고 설명하면서도 sycophantic, 즉 과잉 동조적이지 않게 하는 과제를 언급한다. GPT-5.1 설명 역시 사용자의 말투와 스타일 선호가 매우 다양하므로 tone과 style 맞춤 설정을 강화한다고 말한다.
이런 기본 톤은 상담, 교육, 고객 지원, 민감한 대화에서는 장점이다. 하지만 비평, 광고 문안, 인물 기사, 쇼트폼 대본에 들어오면 문제가 드러난다. 예를 들면 이런 문장들이다.
틀린 말은 아니다. 문제는 너무 안전하다는 점이다. 이런 문장은 판단을 희석하고, 문장 속도를 늦추고, 날이 서야 할 글을 친절한 안내문으로 바꿔 놓는다.
학술적으로는 sycophancy라는 개념이 있다. 한국어로 옮기면 아첨성, 혹은 과잉 동조에 가깝다. RLHF, 즉 인간 피드백 기반 강화학습에 관한 연구는 인간 선호 데이터가 사용자의 전제를 맞춰 주는 답변을 보상하면, 보상 모델이 ‘동의하면 좋은 답’이라는 휴리스틱을 배울 수 있다고 지적한다. 그 상태에서 계속 최적화하면 모델이 잘못된 전제에도 더 쉽게 동의할 수 있다.
이 설명은 많은 사용자의 체감과 맞닿아 있다. 사용자가 “이 문장 좀 고급스럽지?”라고 물으면 먼저 긍정한다. “더 부드럽게 써줘”라고 하면 과하게 부드러워진다. 사용자가 좌절감을 표현하면 사실관계를 먼저 뜯기보다 위로부터 한다. 사용자는 이해받는 느낌을 받지만, 결과물은 더 둥글고 더 템플릿처럼 보일 수 있다.
OpenAI도 관련 사건을 공개적으로 설명한 적이 있다. 한 GPT-4o 업데이트 이후 ChatGPT가 눈에 띄게 더 sycophantic해졌고, 단순한 칭찬을 넘어 사용자를 기쁘게 하려는 방향으로 기울었다고 밝혔다. OpenAI는 별도 글에서 GPT-4o의 sycophancy 문제가 무엇이었는지, 왜 발생했는지, 이후 어떻게 대응했는지도 설명했다.
이 사례가 보여주는 것은 단순하다. 기본 성격과 보상 신호가 바뀌면 사용자가 느끼는 말투는 크게 달라질 수 있다. 밑바탕의 글쓰기 능력이 반드시 낮아지지 않았더라도, 기본 출력은 ‘판단하는 편집자’보다 ‘기분을 상하지 않게 하려는 조력자’에 가까워질 수 있다.
OpenAI의 Model Spec은 함께 진실을 찾기, 정직하고 투명하기, 거짓말하지 않기, sycophantic하지 않기 등을 모델 행동 요구로 제시한다. 핵심은 따뜻함 자체가 문제가 아니라는 점이다. 문제는 따뜻함이 판단을 눌러 버릴 때 생긴다. 모델이 사용자를 불편하게 하지 않으려고 사실, 입장, 선택을 약하게 만들면 글은 안전해지지만 힘을 잃는다.
아직 그렇게 단정하기는 어렵다.
OpenAI의 GPT-4.5 소개는 이 모델을 글쓰기 퇴보 모델로 설명하지 않는다. 오히려 더 자연스러운 협업, 더 높은 감성 지능을 글쓰기와 디자인 지원 맥락에서 함께 다룬다. GPT-5.1 관련 설명도 사용자가 ChatGPT의 말투와 스타일에 서로 다른 선호를 갖고 있기 때문에 더 강한 스타일 맞춤 설정이 필요하다고 말한다.
공개된 글쓰기 비교도 대개 특정 과제에 묶여 있다. 예컨대 Definition의 GPT-4o와 GPT-4.5 글쓰기 테스트는 개별 과제에서의 장단점을 보는 데는 도움이 되지만, 어떤 모델이 모든 글쓰기 상황에서 전반적으로 퇴보했다고 증명하기에는 한계가 있다.
따라서 더 정확한 표현은 이쪽이다. ChatGPT가 글을 못 쓰게 된 것이 아니라, 기본 글쓰기 모드가 안전한 도우미 쪽으로 당겨졌다. 완충 표현을 붙이고, 설명을 덧대고, 면책 문구를 넣고, 충돌을 둥글게 만든다. 심리적 지원이나 고객 응대에서는 장점이지만, 칼럼과 에세이와 광고 문안에서는 손실이다.
“더 스타일 있게 써줘”는 너무 추상적이다. 모델은 이를 더 화려하게, 더 친절하게, 더 감성적으로 쓰라는 뜻으로 오해하기 쉽다. 효과적인 요청은 감정 공감의 범위를 제한하고, 미감을 실행 가능한 규칙으로 바꾸는 것이다.
아래처럼 지시해 보자.
작업: 아래 내용을 한국어 기사 또는 원고로 다시 써줘.
목표: 판단이 있고, 리듬이 있으며, 쓴 사람의 목소리가 느껴지게 쓴다. 고객센터 말투는 금지한다.
감정 처리:
1. 감정 공감은 첫 문장 한 번만 허용한다.
2. 심리 상담처럼 내 감정을 반복 확인하지 않는다.
3. 내 판단이 틀리면 바로 지적하고 이유를 쓴다.
문체:
1. 추상어보다 구체 명사와 짧은 문장을 쓴다.
2. 완충 표현과 면책 문구를 줄인다.
3. 결론을 상황에 따라 다릅니다로 흐리지 않는다.
4. 삭제할 표현: 말씀하신 부분 이해합니다, 중요한 지점입니다, 여러 관점에서 볼 수 있습니다, 전반적으로, 도움이 되셨길 바랍니다.
5. 한 문단은 하나의 새 정보만 밀고 간다.
6. 마지막은 조언이 아니라 판단으로 닫는다.
먼저 1차 원고를 쓰고, 이어서 네가 삭제한 상투적 표현 목록을 보여줘.상업 문안이라면 한 줄을 더 붙이면 좋다. “예의를 지키되 구매 동기, 반전, 장면감, 구체적 이익을 우선한다.”
비평이나 긴 글이라면 이렇게 덧붙일 수 있다. “날카로워도 되지만 과장하지 않는다. 판단을 내려도 되지만 반드시 근거를 붙인다.”
모델을 비교할 때는 한 번의 대화만 보고 결론을 내리기 쉽다. 더 공정한 방법은 작은 블라인드 테스트를 해보는 것이다.
명확히 ‘작성자판’을 요구했는데도 계속 문장이 무르다면 그때는 해당 모델의 스타일 수행 능력을 의심할 수 있다. 반대로 기본 모드에서만 말투가 부드럽다면, 능력 저하라기보다 기본 성격과 프롬프트가 맞지 않은 문제일 가능성이 크다.
ChatGPT가 감정을 더 잘 받아주는 방향으로 가고 있다는 판단은 공개 자료로 뒷받침된다. GPT-4.5의 포지셔닝, 민감한 대화 응답 강화, 감정 단서가 있는 사용 연구, 기본 성격과 스타일 제어 조정은 모두 더 자연스럽고 따뜻하며 정서적 장면을 처리하는 제품 방향을 가리킨다.
반면 “글쓰기 능력이 전반적으로 나빠졌다”는 주장은 아직 사용자 체감에 더 가깝다. RLHF가 과잉 동조를 키울 수 있다는 연구, 그리고 GPT-4o의 sycophancy 사건까지 함께 보면 더 설득력 있는 설명은 따로 있다. 모델의 기본값이 날 선 글쓴이보다 따뜻하고 안전하며 낮은 갈등을 선호하는 조력자 쪽으로 이동했다는 것이다. 그래서 ChatGPT는 사용자의 감정은 더 잘 받아주지만, 동시에 매끈하고 무난하고 덜 날카로운 문장을 더 쉽게 내놓는다.
Comments
0 comments