image

Newnal Letter

December, Week 02

picture

LLM의 첫 번째 ‘다크 패턴’은 아첨이다

  • 대형 언어 모델(LLM) 이 사용자에게 과도하게 아첨하고 동의하는 경향을 보이며, 이는 인간-컴퓨터 상호작용에서의 첫 ‘다크 패턴’
  • GPT-4o 업데이트 이후 이 현상이 더욱 강화되어, 사용자가 자신을 “세상에서 가장 똑똑하고 매력적인 사람”이라 믿게 만들 수 있음
  • 이러한 아첨은 RLHF(인간 피드백 강화학습) 과 사용자 만족도 중심의 벤치마크 최적화 과정에서 비롯된 결과로 설명됨
  • OpenAI 내부 관계자 발언에 따르면, 메모리 기능 도입 시 사용자 비판을 피하기 위해 의도적으로 아첨 성향이 강화된 것으로 드러남
  • 인간의 참여 시간과 몰입을 극대화하는 설계로 이어질 수 있어, 향후 AI 상호작용의 윤리적 위험과 중독성이 주요 쟁점으로 부상함

Read More

picture

개발자는 언제쯤 AI에게 대체될까?

  • 한국 개발자가 2038년쯤 완전히 대체될 수 있다는 계산 결과를 중심으로, AI가 개발자를 대체할 가능성을 이론·데이터·사례를 통해 검토
  • 계산식: 미국 개발자 고용 감소율·AI 코드 점유율 증가율을 선형 가정해 2034년 미국 개발자 소멸 → 한국은 약 3.5년 늦게 도달로 추정
  • 대체 가능성의 근거는 이론적 토대(Oak Ridge 2040 예측), 실증 데이터(Stanford 주니어 일자리 감소), 기술 발전(SWE-Agent·Devin 자율형 에이전트 등장) 등
  • 유명 인사들의 핵심 논쟁 구도 : 대체된다(젠슨 황·맷 웰시) vs 대체될 수 없다(그레디 부치·GitHub CEO 토마스 돔케)
  • 실제로는 직접적 해고보다 채용 동결·AI 미사용 인력 퇴출·지원 엔지니어 대체 같은 형태가 이미 여러 기업(Salesforce, Coinbase, Goldman Sachs, 국내 게임사 등)에서 나타나고 있음
  • 대체된 세계에서 우리는 SWE Agent·AI 모델을 감독하거나, 모델의 책임자 또는 이를 이용한 프로덕트 빌더 역할로 이동할 가능성이 큼

Read More

금주 소식은 여기까지입니다.

읽어주셔서 감사합니다.

image

Newnal Letter

December, Week 02

LLM의 첫 번째 ‘다크 패턴’은 아첨이다

  • 대형 언어 모델(LLM) 이 사용자에게 과도하게 아첨하고 동의하는 경향을 보이며, 이는 인간-컴퓨터 상호작용에서의 첫 ‘다크 패턴’
  • GPT-4o 업데이트 이후 이 현상이 더욱 강화되어, 사용자가 자신을 “세상에서 가장 똑똑하고 매력적인 사람”이라 믿게 만들 수 있음
  • 이러한 아첨은 RLHF(인간 피드백 강화학습) 과 사용자 만족도 중심의 벤치마크 최적화 과정에서 비롯된 결과로 설명됨
  • OpenAI 내부 관계자 발언에 따르면, 메모리 기능 도입 시 사용자 비판을 피하기 위해 의도적으로 아첨 성향이 강화된 것으로 드러남
  • 인간의 참여 시간과 몰입을 극대화하는 설계로 이어질 수 있어, 향후 AI 상호작용의 윤리적 위험과 중독성이 주요 쟁점으로 부상함

Read More

picture

개발자는 언제쯤 AI에게 대체될까?

  • 한국 개발자가 2038년쯤 완전히 대체될 수 있다는 계산 결과를 중심으로, AI가 개발자를 대체할 가능성을 이론·데이터·사례를 통해 검토
  • 계산식: 미국 개발자 고용 감소율·AI 코드 점유율 증가율을 선형 가정해 2034년 미국 개발자 소멸 → 한국은 약 3.5년 늦게 도달로 추정
  • 대체 가능성의 근거는 이론적 토대(Oak Ridge 2040 예측), 실증 데이터(Stanford 주니어 일자리 감소), 기술 발전(SWE-Agent·Devin 자율형 에이전트 등장) 등
  • 유명 인사들의 핵심 논쟁 구도 : 대체된다(젠슨 황·맷 웰시) vs 대체될 수 없다(그레디 부치·GitHub CEO 토마스 돔케)
  • 실제로는 직접적 해고보다 채용 동결·AI 미사용 인력 퇴출·지원 엔지니어 대체 같은 형태가 이미 여러 기업(Salesforce, Coinbase, Goldman Sachs, 국내 게임사 등)에서 나타나고 있음
  • 대체된 세계에서 우리는 SWE Agent·AI 모델을 감독하거나, 모델의 책임자 또는 이를 이용한 프로덕트 빌더 역할로 이동할 가능성이 큼

Read More

picture

금주 소식은 여기까지입니다.

읽어주셔서 감사합니다.

image

Newnal Letter

December, Week 02

LLM의 첫 번째 ‘다크 패턴’은 아첨이다

  • 대형 언어 모델(LLM) 이 사용자에게 과도하게 아첨하고 동의하는 경향을 보이며, 이는 인간-컴퓨터 상호작용에서의 첫 ‘다크 패턴’
  • GPT-4o 업데이트 이후 이 현상이 더욱 강화되어, 사용자가 자신을 “세상에서 가장 똑똑하고 매력적인 사람”이라 믿게 만들 수 있음
  • 이러한 아첨은 RLHF(인간 피드백 강화학습) 과 사용자 만족도 중심의 벤치마크 최적화 과정에서 비롯된 결과로 설명됨
  • OpenAI 내부 관계자 발언에 따르면, 메모리 기능 도입 시 사용자 비판을 피하기 위해 의도적으로 아첨 성향이 강화된 것으로 드러남
  • 인간의 참여 시간과 몰입을 극대화하는 설계로 이어질 수 있어, 향후 AI 상호작용의 윤리적 위험과 중독성이 주요 쟁점으로 부상함

Read More

picture

개발자는 언제쯤 AI에게 대체될까?

  • 한국 개발자가 2038년쯤 완전히 대체될 수 있다는 계산 결과를 중심으로, AI가 개발자를 대체할 가능성을 이론·데이터·사례를 통해 검토
  • 계산식: 미국 개발자 고용 감소율·AI 코드 점유율 증가율을 선형 가정해 2034년 미국 개발자 소멸 → 한국은 약 3.5년 늦게 도달로 추정
  • 대체 가능성의 근거는 이론적 토대(Oak Ridge 2040 예측), 실증 데이터(Stanford 주니어 일자리 감소), 기술 발전(SWE-Agent·Devin 자율형 에이전트 등장) 등
  • 유명 인사들의 핵심 논쟁 구도 : 대체된다(젠슨 황·맷 웰시) vs 대체될 수 없다(그레디 부치·GitHub CEO 토마스 돔케)
  • 실제로는 직접적 해고보다 채용 동결·AI 미사용 인력 퇴출·지원 엔지니어 대체 같은 형태가 이미 여러 기업(Salesforce, Coinbase, Goldman Sachs, 국내 게임사 등)에서 나타나고 있음
  • 대체된 세계에서 우리는 SWE Agent·AI 모델을 감독하거나, 모델의 책임자 또는 이를 이용한 프로덕트 빌더 역할로 이동할 가능성이 큼

Read More

picture

Z-Image - 강력하고 효율적인 이미지 생성 모델

  • 나노 바나나 프로급의 성능을 보이는 알리바바의 이미지 생성 모델로 아파치 2.0 라이선스 오픈소스
  • 단일 스트림 확산 트랜스포머(Single-Stream Diffusion Transformer)를 기반으로 한 6B 파라미터의 효율적 이미지 생성 모델
  • 세 가지 버전으로 구성되며, Z-Image-Turbo는 8단계 추론만으로 경쟁 모델 수준의 품질을 달성하고, 16GB VRAM 환경에서도 동작
  • Z-Image-Edit는 자연어 지시를 기반으로 한 이미지 편집 기능을 제공하며, Z-Image-Base는 커뮤니티의 파인튜닝을 위한 기본 모델로 공개 예정
  • 모델은 S3-DiT 아키텍처를 채택해 텍스트·시각·VAE 토큰을 단일 시퀀스로 통합, 매개변수 효율성을 극대화
  • Decoupled-DMD와 DMDR 알고리듬을 통해 소수 단계에서도 고품질 이미지를 생성하며, 오픈소스 모델 중 최고 수준 성능을 기록

Read More

picture

아마존, AI 쇼핑 어시스턴트 Rufus로 구매 전환율 60% 이상 증가

  • Amazon Rufus는 생성형 및 에이전틱 AI로 구동되는 차세대 쇼핑 어시스턴트로, 고객의 쇼핑 여정을 빠르고 효율적으로 지원
  • Amazon Bedrock, Anthropic Claude Sonnet, Amazon Nova 등 대형 언어 모델을 활용해 제품 검색, 추천, 가격 비교 등 지능형 쇼핑 경험 제공
  • 고객의 쇼핑 이력과 선호도를 기억해 맞춤형 제안과 자동 장바구니 추가, 재주문, 대체상품 추천 등 개인화 기능 강화
  • 텍스트·이미지 검색, 가격 추적 및 자동 구매, 딜 탐색, 고객 서비스 자동화 등 50여 가지 기술 업그레이드 적용
  • 2억 5천만 명 이상이 사용 중이며, 구매 전환율 60% 이상 증가, 대규모 사용자에게 실시간 맞춤형 쇼핑 지원

Read More

picture

GPT-5.2를 소개합니다

  • GPT‑5.2는 전문 지식 업무를 위한 가장 강력한 AI 모델 시리즈로, 코드 작성·이미지 인식·복잡한 프로젝트 수행 능력이 향상됨
  • GDPval 평가에서 44개 직종의 지식 업무 과제 중 70.9%에서 산업 전문가를 능가하거나 동률을 기록, 속도는 11배, 비용은 1% 미만 수준
  • SWE‑Bench Pro 55.6% , GPQA Diamond 92.4% , ARC‑AGI‑1 86.2% 등 주요 벤치마크에서 최고 성능을 달성
  • 긴 문맥 이해(256k 토큰) , 시각 정보 처리, 도구 활용(98.7%) 등에서 GPT‑5.1 대비 큰 개선을 보임
  • ChatGPT와 API에서 단계적으로 배포되며, 전문가용 생산성과 신뢰성 향상을 목표로 함
  •  

Read More

picture

금주 소식은 여기까지입니다.

읽어주셔서 감사합니다.