Hugging Face
후보를 제시하고, 그 후 정제하기: LLM 기반 데이터 주석을 위한 교사-학생 프레임워크
4시간 전
Hugging Face
Infinity Instruct: 명령 선택 및 합성을 확장하여 언어 모델 강화하기
4시간 전
Hugging Face
본질적으로 신뢰할 수 있는 비전 트랜스포머의 주의 맵
4시간 전
Hugging Face
ASR 성능 향상을 위한 TTS 합성 데이터 기반의 자기 개선 프레임워크
4시간 전
Hugging Face
보상 모델을 통한 확장 가능한 코드 검증: 정확성과 처리량의 균형
4시간 전
Hugging Face
LoRA-Edit: 제어 가능한 첫 프레임 기반 비디오 편집을 위한 마스크 인식 LoRA 미세 조정
4시간 전
Hugging Face
Mirage-1: 계층적 멀티모달 기술로 GUI 에이전트 증강 및 업데이트
4시간 전
Hugging Face
루브릭 기반 합성 데이터를 활용한 설정 가능한 선호도 튜닝
4시간 전
Hugging Face
JAFAR: 모든 해상도에서 모든 특징을 증폭하기
4시간 전
Hugging Face
유해 밈 탐지: 분리된 이해와 안내된 CoT 추론
4시간 전
Hugging Face
밀집 검색기는 간단한 쿼리에서 실패할 수 있다: 임베딩의 세분화 딜레마 드러내기
4시간 전
Hugging Face
생각 연속 토큰 학습을 통한 테스트 시간 확장 향상
4시간 전
Hugging Face
Med-PRM: 단계별 가이드라인 검증 프로세스 보상을 통한 의료 추론 모델
4시간 전
Hugging Face
SkillBlender: 다재다능한 휴머노이드 전신 로코-조작을 위한 기술 블렌딩
4시간 전
Hugging Face
고품질 데이터셋과 신뢰할 수 있는 평가를 통한 이미지-텍스트 생성 연구
4시간 전
Hugging Face
DeepVideo-R1: 난이도 인식 회귀 GRPO를 통한 비디오 강화 미세 조정
4시간 전
Hugging Face
병렬화 가능한 선형 소스 전이 마크 네트워크 (pLSTM)
4시간 전
Hugging Face
동질적 주의 메커니즘을 넘어: 푸리에 근사화된 KV 캐시를 통한 메모리 효율적 대형 언어 모델
4시간 전
Hugging Face
피드백 마찰: 대형 언어 모델이 외부 피드백을 완전히 통합하는 데 어려움을 겪다
4시간 전
Hugging Face
SwS: 자기 인식 약점 기반 문제 생성 강화 학습을 통한 LLM 추론
4시간 전
Hugging Face
LiveCodeBench Pro: 올림피아드 메달리스트들은 경쟁 프로그래밍에서 LLM을 어떻게 평가할까?
4시간 전
Hugging Face
ViCrit: 시각적 인식을 위한 검증 가능한 강화 학습 프록시 작업
4시간 전
Hugging Face
확산 이중성
4시간 전
Hugging Face
교차 모달 주의 주입을 통한 정렬된 새로운 뷰 이미지 및 기하학 합성
4시간 전
Hugging Face
정책 준수 에이전트의 효과적인 레드팀 테스트
4시간 전
Hugging Face
StreamSplat: 보정되지 않은 비디오 스트림에서의 온라인 동적 3D 재구성을 향하여
1일 전
Hugging Face
MCA-Bench: VLM 기반 공격에 대한 CAPTCHA 견고성 평가를 위한 멀티모달 벤치마크
1일 전
Hugging Face
LaMP-Cap: 개인화된 그림 캡션 생성 - 멀티모달 그림 프로필을 활용하여
1일 전
Hugging Face
데이터 사일로 허물기: 생성적 지속 학습을 통한 개방적이고 확장 가능한 모빌리티 기반 모델로의 전환
1일 전
Hugging Face
언어 모델의 계층적 잠재 능력 발견을 위한 인과적 표현 학습
1일 전
Hugging Face
진실과 거짓을 넘어서: 세밀한 주장에 대한 검색 보강 계층적 분석
1일 전
Hugging Face
TaxoAdapt: LLM 기반 다차원 분류 체계 구축을 진화하는 연구 자료에 맞추기
1일 전
Hugging Face
LLM 학습 제거는 형식에 의존하지 않아야 한다
1일 전
Hugging Face
초안 기반 근사 추론을 통한 LLM 최적화
1일 전
Hugging Face
EmbodiedGen: 구현된 지능을 위한 생성적 3D 월드 엔진
1일 전
Hugging Face
TeleMath: 대형 언어 모델의 통신 수학 문제 해결을 위한 벤치마크
1일 전
Hugging Face
NoLoCo: 대규모 모델을 위한 No-all-reduce 저통신 훈련 방법
1일 전
Hugging Face
토큰 교란 유도 기법을 활용한 확산 모델
1일 전
Hugging Face
MLP 활성화를 해석 가능한 특징으로 분해하기: 반비음수 행렬 분해를 통해
1일 전
Hugging Face
추론 시간 기법을 통한 미세 조정된 트랜스포머의 능력 유도
1일 전
Hugging Face
VerIF: 강화 학습에서의 명령어 수행 검증 공학
1일 전
Hugging Face
UniPre3D: 3D 포인트 클라우드 모델의 통합 사전 학습과 크로스 모달 가우시안 스플래팅
1일 전
Hugging Face
DreamActor-H1: 고품질 인간-제품 시연 비디오 생성
1일 전
Hugging Face
좋은 자연어 프롬프트란 무엇인가?
1일 전
Hugging Face
복합 AI 시스템 최적화: 방법, 도전 과제 및 미래 방향에 대한 조사
1일 전
Hugging Face
CreatiPoster: 편집 가능하고 제어 가능한 다층 그래픽 디자인 생성
1일 전
Hugging Face
ChineseHarm-Bench: 중국 유해 콘텐츠 탐지 벤치마크
1일 전
Hugging Face
에이전트를 위한 웹을 구축하라, 웹을 위한 에이전트를 만들지 말라
1일 전
Hugging Face
VideoDeepResearch: 에이전트 도구를 사용한 장시간 비디오 이해
1일 전
Hugging Face
AutoMind: 적응형 지식 에이전트를 통한 자동화된 데이터 과학
1일 전
Hugging Face
Resa: 투명한 추론 모델을 위한 SAEs
1일 전
Hugging Face
Optimus-3: 범용 멀티모달 마인크래프트 에이전트를 향하여
1일 전
Hugging Face
사고의 환상: 문제 복잡성의 관점에서 추론 모델의 강점과 한계 이해하기
1일 전
Hugging Face
Domain2Vec: 데이터셋을 벡터화하여 최적의 데이터 혼합 찾기 (훈련 없이)
1일 전
Hugging Face
Ming-Omni: 통합된 다중 모달 모델을 통한 인식과 생성
1일 전
Hugging Face
PosterCraft: 고품질 미적 포스터 생성의 통합 프레임워크 재고
1일 전
Hugging Face
세밀한 교란 안내를 위한 주의 헤드 선택
1일 전
Hugging Face
이산 오디오 토큰: 설문 조사 그 이상!
1일 전
Hugging Face
VRBench: 장편 내러티브 비디오에서 다단계 추론을 위한 벤치마크
1일 전
Hugging Face
텍스트 인식 이미지 복원: 확산 모델을 활용하여
1일 전
Hugging Face
AniMaker: 자동화된 다중 에이전트 애니메이션 스토리텔링과 MCTS 기반 클립 생성
1일 전
Hugging Face
Magistral
1일 전
Hugging Face
SWE-Factory: 이슈 해결 훈련 데이터 및 평가 벤치마크를 위한 자동화된 공장
1일 전
Hugging Face
ReasonMed: 의료 추론을 위한 370K 다중 에이전트 생성 데이터셋
1일 전
Hugging Face
언제 맥락을 신뢰할 것인가: 맥락 신뢰성을 위한 자기 반영적 토론
4일 전
Hugging Face
대형 언어 모델에서의 쿼리 수준 불확실성
4일 전
Hugging Face
Kvasir-VQA-x1: 의료 추론 및 강력한 MedVQA를 위한 다중 모달 데이터셋
4일 전
Hugging Face
직교 동등 변환을 통한 재매개변수화된 LLM 훈련
4일 전
Hugging Face
MIRAGE: 포괄적인 망막 OCT 이미지 분석을 위한 다중 모달 기초 모델 및 벤치마크
4일 전
Hugging Face
비디오 확산 모델 미세 조정을 위한 프레임 간 표현 정렬
4일 전
Hugging Face
숨겨진 명백함: VLM은 그들의 시각적 표현을 간과한다
4일 전
Hugging Face
UFM: 흐름을 통한 통합 밀집 대응의 간단한 경로
4일 전
Hugging Face
비전은 중요하다: 간단한 시각적 변형이 멀티모달 수학 추론을 향상시킬 수 있다
4일 전
Hugging Face
SAFE: 비전-언어-행동 모델을 위한 멀티태스크 실패 탐지
4일 전
Hugging Face
이제 이야기할 시간: 마피아 게임에서 비동기 그룹 통신을 위한 LLM 에이전트
4일 전
Hugging Face
FP32 아니면 죽음을? 재현 가능한 추론을 위한 도전과 해결책
4일 전
Hugging Face
InterActHuman: 다중 개념 인간 애니메이션과 레이아웃 정렬 오디오 조건
4일 전
Hugging Face
SWE-Flow: 테스트 주도 방식으로 소프트웨어 공학 데이터 합성하기
4일 전
Hugging Face
SeerAttention-R: 긴 추론을 위한 희소 주의 적응
4일 전
Hugging Face
자동 회귀 대 흐름 매칭: 텍스트-음악 생성 모델링 패러다임 비교 연구
4일 전
Hugging Face
PlayerOne: 자아 중심 세계 시뮬레이터
4일 전
Hugging Face
멀티버스: 당신의 언어 모델이 비밀리에 병렬화 및 생성 병합을 결정합니다
4일 전
Hugging Face
ComfyUI-R1: 워크플로우 생성에 대한 추론 모델 탐구
4일 전
Hugging Face
자가회귀 적대적 후속 훈련을 통한 실시간 상호작용 비디오 생성
4일 전
Hugging Face
Seedance 1.0: 비디오 생성 모델의 경계를 탐구하다
4일 전
Hugging Face
자신감이 전부다: 언어 모델의 Few-Shot RL 미세 조정
4일 전