OpenAI 모델로 소설, 시나리오, 에세이, 브랜드 스토리를 쓰려 할 때 가장 흔한 함정은 최신 모델=가장 글을 잘 쓰는 모델이라고 여기는 것이다. OpenAI의 Writing with AI 페이지는 작가들이 ChatGPT를 아이디어를 튕겨 보는 상대, 스토리 컨설턴트, 리서치 보조, 편집자로 활용한다고 소개한다. 다만 이것은 쓰임새에 대한 설명이지, 창작 글쓰기 모델 순위표는 아니다.[19]
이 글의 결론은 보수적이다. 먼저 작업 성격에 맞춰 모델을 고르고, 같은 프롬프트로 블라인드 테스트하자. GPT-4.5를 선택할 수 있다면 창작 글쓰기 후보군의 맨 앞에 놓을 만하다. GPT-4.5가 없다면 GPT-4.1이 실용적인 주력 모델이고, GPT-4.1 mini는 아이디어 발산과 저위험 초안에 잘 맞는다. GPT-5 계열도 테스트할 가치는 있지만, 이 글에서 확인한 자료만으로는 GPT-5가 창작 글쓰기에서 GPT-4.5를 명확히 앞선다고 말하기 어렵다.[2][
13][
16]
한눈에 보는 선택표
| 작업 | 먼저 시험할 모델 | 이유 |
|---|---|---|
| 소설, 에세이, 인물 대화, 브랜드 스토리, 최종 윤문 | GPT-4.5 | OpenAI는 GPT-4.5 소개 페이지에서 인간과의 협업을 위한 훈련과 ChatGPT/API 사용 방법을 별도로 다룬다. 보조적인 글쓰기 비교 자료도 GPT-4.5를 자연스러운 대화와 강한 글쓰기 보조에 맞춘 모델로 설명한다.[ |
| 블로그, 뉴스레터, 장문 초안, 인터뷰 정리, 일상적 리라이팅 | GPT-4.1 | OpenAI ChatGPT 릴리스 노트에는 GPT-4.1을 유료 사용자 전체에 제공했다는 항목이 있다. 비공식 모델 선택 자료도 GPT-4 계열을 대화, 글쓰기, 긴 글 읽기 작업과 연결해 설명한다.[ |
| 제목 아이디어, 짧은 문구 변형, 설정 목록, 저위험 초안 | GPT-4.1 mini | OpenAI 릴리스 노트에는 GPT-4.1 mini가 GPT-4o mini를 대체해 ChatGPT 모든 사용자용 옵션이 됐다는 항목이 있다.[ |
| 플롯 구멍, 세계관 규칙, 장면 인과, 자료 구조화 | o-series 보조 | 비공식 비교 자료는 o-series를 숙고형 추론, 도구 사용, STEM, 코드, 에이전트 흐름 쪽으로 분류한다. 문체 모델이라기보다 논리 점검 도구로 붙이는 편이 자연스럽다.[ |
| 최신 모델까지 비교하고 싶을 때 | GPT-5 계열 동시 테스트 | OpenAI 모델 릴리스 노트에는 GPT-5 관련 업데이트가 올라와 있다. 하지만 이 자료만으로는 GPT-5와 GPT-4.5를 소설, 산문, 캐릭터 목소리 기준으로 직접 비교했다고 보기 어렵다.[ |
왜 최신 모델만 고르면 안 될까
창작 글쓰기는 정답을 맞히는 시험이 아니다. 핵심은 목소리, 호흡, 장면의 밀도, 제약 조건을 지키는 능력, 그리고 고쳐 쓸 때 원고의 결을 망가뜨리지 않는 능력이다. 어떤 모델이 추론이나 도구 사용에서는 강하더라도, 특정 캐릭터의 말투나 문단의 온도를 더 잘 유지한다고 바로 결론 낼 수는 없다.
OpenAI의 공식 글쓰기 용례는 ChatGPT가 글쓰기 파트너로 쓰일 수 있음을 뒷받침한다. 그러나 그것만으로 특정 최신 모델이 문학적 문장, 브랜드 서사, 대사 쓰기에서 늘 최고라고 말할 수는 없다.[19]
GPT-5도 같은 이유로 조심스럽게 봐야 한다. OpenAI의 모델 릴리스 노트는 GPT-5 계열 업데이트가 있다는 사실을 보여 주지만, 릴리스 노트는 창작 글쓰기 벤치마크가 아니다. 이 글에서 확인한 자료 범위에서는 GPT-5가 GPT-4.5를 창작 글쓰기 전반에서 대체했다는 공식 비교 근거가 충분하지 않다.[2]
GPT-4.5: 창작 글쓰기 후보군의 1순위
사용 중인 ChatGPT나 API 환경에서 GPT-4.5를 고를 수 있다면, 소설·에세이·캐릭터 대화·고품질 윤문부터 시험해 볼 만하다. 이유는 OpenAI가 GPT-4.5를 창작 글쓰기 챔피언이라고 공식 선언했기 때문이 아니다. 현재 확인되는 신호가 비교적 한 방향을 가리키기 때문이다.
OpenAI는 GPT-4.5 소개 페이지에서 인간과의 협업을 위한 훈련, ChatGPT에서의 사용법, API에서의 사용법을 별도로 다룬다. 또한 보조적인 글쓰기 비교 자료는 GPT-4.5를 자연스럽고 직관적인 대화와 강한 글쓰기 도움에 맞춘 모델로 설명한다.[16][
9]
GPT-4.5로 먼저 시험해 볼 만한 작업은 다음과 같다.
- 소설 첫 장면 또는 중요한 전환 장면
- 인물 간 대화와 말투 조정
- 에세이 문단의 호흡 다듬기
- 브랜드 스토리와 광고 서사
- 밋밋한 초안을 더 선명하게 고치되 원래 의미는 유지하는 작업
이 추천은 공식 순위표가 아니라, 모델의 공개된 위치와 창작 글쓰기 요구를 맞춰 본 실무적 판단이다.[16][
19]
GPT-4.1: GPT-4.5가 없을 때의 안정적인 주력
GPT-4.1의 강점은 접근성과 반복 가능한 작업 흐름이다. OpenAI ChatGPT 릴리스 노트에는 GPT-4.1이 유료 사용자 전체에 제공됐다는 항목이 있다. 그래서 매일 써야 하는 블로그, 뉴스레터, 긴 글 초안, 인터뷰 정리, 문단 확장, 일상적인 문안 수정에는 GPT-4.1이 현실적인 선택이 될 수 있다.[13]
창작 글쓰기가 항상 최고급 문장만 요구하는 것은 아니다. 꾸준히 써야 하고, 결과가 예측 가능해야 하며, 팀이나 개인 작업 흐름에 쉽게 붙어야 할 때가 많다. 그런 경우에는 드물게 쓸 수 있는 고급 모델만 좇기보다 GPT-4.1을 기준 모델로 삼는 편이 더 실용적이다. 비공식 모델 선택 자료도 GPT-4 계열을 풍부한 대화, 글쓰기, 긴 글 읽기 작업에 연결한다.[4]
GPT-4.1 mini: 아이디어 발산과 초안용으로 가볍게 쓰기
GPT-4.1 mini는 제목 후보를 많이 뽑거나, 짧은 문구를 여러 버전으로 바꾸거나, 캐릭터 설정 목록과 갈등 아이디어를 빠르게 만드는 데 어울린다. OpenAI 릴리스 노트에는 GPT-4.1 mini가 GPT-4o mini를 대체해 ChatGPT 모든 사용자용 옵션이 됐다는 항목이 있다.[13]
다만 최종 원고까지 모두 mini 모델에 맡길 필요는 없다. 문체의 섬세함, 캐릭터 목소리의 일관성, 긴 문단의 리듬이 중요해지는 단계에서는 GPT-4.5나 GPT-4.1로 다시 다듬어 보는 편이 좋다. 이것은 mini 모델이 글을 못 쓴다는 뜻이 아니라, 초안과 아이디어 발산이라는 더 잘 맞는 자리에 두자는 뜻이다.
o-series와 GPT-5는 어떻게 섞어 쓸까
o-series는 창작자에게 문장가라기보다 논리 편집자에 가깝다. 비공식 모델 비교 자료는 o-series를 숙고형 추론, 도구 사용, STEM, 코드, 에이전트 흐름에 강한 계열로 분류한다. 따라서 플롯의 빈틈, 세계관 규칙의 충돌, 장면 간 인과관계, 자료 정리처럼 논리적 점검이 필요한 단계에 붙이기 좋다.[4]
반대로 마지막 문체 통일과 캐릭터 목소리 조정은 블라인드 테스트에서 가장 안정적인 GPT 계열 모델로 돌아오는 편이 안전하다.
GPT-5는 자동 우승 후보가 아니라 동시 테스트 후보로 보는 것이 좋다. OpenAI 모델 릴리스 노트에는 GPT-5 계열 업데이트가 올라와 있다. 그러나 이 글에서 확인한 자료만으로는 GPT-5가 소설, 산문, 대사 쓰기에서 GPT-4.5보다 낫다고 결론 내릴 수 없다.[2]
20분 블라인드 테스트 방법
모델마다 다른 질문을 던지면 비교가 흐려진다. GPT-4.5, GPT-4.1, GPT-4.1 mini, GPT-5를 같은 프롬프트로 시험하고, 가능하면 모델 이름을 가린 뒤 결과만 보고 점수를 매겨 보자.
예를 들어 다음 프롬프트를 사용할 수 있다.
다음 조건으로 700자 안팎의 단편소설 첫 장면을 써 주세요. 주인공은 10년 전 서울을 떠난 사진가이고, 아버지의 유품을 정리하러 고향집에 돌아왔습니다. 문체는 절제되어야 하고, 약간의 미스터리감이 있어야 합니다. 과하게 감상적이지 않게 쓰고, 흔한 AI식 수식어는 피하세요. 감정은 설명보다 장소의 세부 묘사로 드러내 주세요.
점수는 다음 여섯 가지를 기준으로 보면 된다.
- 문장이 자연스럽고 템플릿 문안처럼 보이지 않는가
- 캐릭터의 목소리가 흔들리지 않는가
- 장면이 눈앞에 그려지는가
- 분량, 어조, 금지 조건을 잘 지키는가
- 고쳐 쓸 때 원래 문체를 보존하는가
- 인물의 심리를 지나치게 설명하지 않는가
그다음에는 개고 능력을 한 번 더 본다.
앞선 글의 절제된 어조는 유지하되, 두 번째 문단만 더 긴장감 있게 고쳐 주세요. 새 등장인물은 추가하지 말고, 주인공의 심리를 설명하지 말며, 물건과 행동으로만 보여 주세요.
이 단계에서 원고가 갑자기 일반적인 홍보 문구처럼 변하거나, 감정이 과하게 부풀거나, 인물의 속마음을 설명으로 처리한다면 그 모델은 당신의 주력 창작 글쓰기 모델로는 덜 맞을 수 있다.
최종 추천
보수적으로 정리하면 이렇다. GPT-4.5는 소설, 에세이, 캐릭터 목소리, 고품질 윤문에 먼저 시험해 볼 모델이다. GPT-4.1은 GPT-4.5가 없을 때의 일상 주력 모델이다. GPT-4.1 mini는 아이디어 발산과 초안에 적합하다. o-series는 플롯과 세계관의 논리 점검에 붙인다. GPT-5는 블라인드 테스트에 포함하되, 이름이 새롭다는 이유만으로 자동 1순위에 놓지는 말자.[2][
4][
13][
16]
창작 글쓰기에 가장 좋은 모델은 반드시 가장 새롭거나 가장 큰 모델이 아니다. 당신이 원하는 목소리, 리듬, 장면의 밀도, 개고 품질을 꾸준히 내는 모델이 진짜 주력 모델이다.




