LeethubLeethub
JobsCompaniesBlog
Go to dashboard

Leethub

Curated tech jobs from FAANG and top companies worldwide.

Top Companies

  • Google Jobs
  • Meta Jobs
  • Amazon Jobs
  • Apple Jobs
  • Netflix Jobs
  • All Companies →

Job Categories

  • Software Engineering
  • Data, AI & Machine Learning
  • Product Management
  • Design & User Experience
  • Operations & Strategy
  • Remote Jobs
  • All Categories →

Browse by Type

  • Remote Jobs
  • Hybrid Jobs
  • Senior Positions
  • Entry Level
  • All Jobs →

Resources

  • Google Interview Guide
  • Salary Guide 2025
  • Salary Negotiation
  • LeetCode Study Plan
  • All Articles →

Company

  • Dashboard
  • Privacy Policy
  • Contact Us
© 2026 Leethub LLC. All rights reserved.
Home›Jobs›42dot›LLM Engineer (Reinforcement Learning)
42dot

About 42dot

Revolutionizing urban transportation with UMOS

🏢 Tech👥 51-250📅 Founded 2019📍 Seoul, Korea, South

Key Highlights

  • Developing the Urban Mobility Operating System (UMOS)
  • Based in Seoul, South Korea, with a team of 51-250
  • Focused on transitioning to autonomous transportation solutions
  • Aims to enhance urban mobility and reduce congestion

42dot is a technology company based in Seoul, South Korea, focused on transforming urban transportation with its Urban Mobility Operating System (UMOS). This cloud-based platform aims to streamline mobility services and facilitate the transition to autonomous vehicles. With a growing team of 51-250 ...

🎁 Benefits

Employees enjoy competitive salaries, stock options, flexible working hours, and a generous PTO policy. The company also offers remote work options an...

🌟 Culture

42dot fosters a culture of innovation and agility, encouraging employees to contribute ideas that drive the future of transportation. The company valu...

🌐 Website💼 LinkedIn𝕏 TwitterAll 103 jobs →
42dot

LLM Engineer (Reinforcement Learning)

42dot • Pangyo (Software Dream Center), South Korea

Posted 9 months ago🏛️ On-SiteMid-LevelAi engineer📍 Pangyo
Apply Now →

Job Description

We are looking for the best

LLM Engineer(Reinforcement Learning)는 LLM학습 파이프라인을 설계하여 실서비스에서 활용 가능한 생성형 언어모델을 학습합니다. 지속적인 품질 향상을 위하여 끊임없이 새로운 방법론을 시도하여, 실사용자에게 꼭 필요한 서비스를 출시하고, LLM 스스로 품질을 개선할 수 있도록 가다듬는 일에 기여합니다.

Responsibilities

  • LLM학습 과정의 효율 향상

    • PLM 또는 Fine-tuned LLM의 Direct Alignment Algorithm / PPO, GRPO, DPO 등을 이용한 학습 과정의 전반적인 효율 향상

  • 생성 결과의 전반적인 정확성과 안정성 향상

    • 생성 결과의 품질 향상을 위하여 Reward Hacking을 방지하고, Self-Refine이 가능한 학습 구조 설계

  • 외부 지식 및 API와 연동 가능한 기초 모델 개발

    • 지시의 종류에 따라 스스로 필요한 외부 연동 Tool을 선택하는 LLM 학습

Qualifications

  • Deep Learning 또는 NLP 관련 경력 3년 이상 (석사 신입 지원 가능)

  • 숙련된 프로그래밍 (Python & pytorch) 능력

  • PyTorch를 활용한 모델 설계, 학습, 평가 및 최적화 경험

  • GPU를 활용한 LLM 학습 및 Trouble shooting 능력

  • 분산 학습 프레임워크(Slurm, DDP, Horovod 등) 사용 경험

  • 동료와의 원활한 협업 능력

Preferred Qualifications

  • Deep Learning/NLP 관련 논문 제출 또는 석박사 학위 소지자

    • 주요 학술 대회(ACL, EMNLP, NeurIPS 등) 논문 발표 경험

  • Docker 및 Kubernetes에 대한 경험

    • GPU 클러스터를 활용한 학습 파이프라인 설계 및 관리 경험

  • GPU를 활용한 학습 및 서비스 개발 경험

    • GPU 기반의 Training 또는 Inference 시스템 구축 경험

  • LLM의 Post-training 관련 경험

    • Supervised Fine-Tuning 및 Parameter Efficient Fine-Tuning 활용 경험

Interview Process

  • 서류전형 - 코딩테스트 - 화상면접 (1시간 내외) - 대면 혹은 화상면접 (3시간 내외) - 최종합격

  • 전형절차는 직무별로 다르게 운영될 수 있으며, 일정 및 상황에 따라 변동될 수 있습니다.

  • 전형일정 및 결과는 지원서에 등록하신 이메일로 개별 안내드립니다.

Additional Information

  • 이력서 제출 시 주민등록번호, 가족관계, 혼인 여부, 연봉, 사진, 신체조건, 출신 지역 등 채용절차법상 요구 금지된 정보는 제외 부탁드립니다.

  • 모든 제출 파일은 30MB 이하의 PDF 양식으로 업로드를 부탁드립니다. (이력서 업로드 중 문제가 발생한다면 이력서와 함께 지원하시고자 하는 포지션의 URL을 recruit@42dot.ai으로 전송 부탁드립니다.)

  • 인터뷰 프로세스 종료 후 지원자의 동의하에 평판조회가 진행될 수 있습니다.

  • 국가보훈대상자 및 취업보호 대상자는 관계법령에 따라 우대합니다.

  • 장애인 고용 촉진 및 직업재활법에 따라 장애인 등록증 소지자를 우대합니다.

  • 42dot은 의뢰하지 않은 서치펌의 이력서를 받지 않으며, 요청하지 않은 이력서에 대해 수수료를 지불하지 않습니다.

※ 지원 전 아래 내용을 꼭 확인해 주세요.

  • 42dot이 일하는 방식, 42dot Way 보러가기 →

  • 42dot만의 업무몰입 프로그램, Employee Engagement Program 보러가기 →

Interested in this role?

Apply now or save it for later. Get alerts for similar jobs at 42dot.

Apply Now →Get Job Alerts