arXiv ID:
2510.02994
迈向可扩展且一致的3D编辑 / Towards Scalable and Consistent 3D Editing
1️⃣ 一句话总结
这篇论文通过构建大规模3D编辑数据集并提出一种无需手动标注就能保持3D结构完整性的新模型,解决了3D编辑中视图不一致和结构失真的难题,实现了更精确、高效的3D内容修改。
迈向可扩展且一致的3D编辑 / Towards Scalable and Consistent 3D Editing
这篇论文通过构建大规模3D编辑数据集并提出一种无需手动标注就能保持3D结构完整性的新模型,解决了3D编辑中视图不一致和结构失真的难题,实现了更精确、高效的3D内容修改。
面向隐私合成文本的受控生成 / Controlled Generation for Private Synthetic Text
这项研究提出了一种结合实体控制代码的新方法,能够在医疗和法律等敏感领域生成既保护个人隐私又保持文本实用性的合成文本。
zELO:受ELO启发的重排器和嵌入模型训练方法 / zELO: ELO-inspired Training Method for Rerankers and Embedding Models
这篇论文提出了一种名为zELO的新型训练方法,通过利用无监督数据训练出性能卓越的重排模型,在金融、法律、代码和科学等多个领域的检索任务中超越了现有的闭源模型,并展现出强大的跨领域适应能力。
OmniWorld:用于4D世界建模的多领域多模态数据集 / OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling
这篇论文提出了一个名为OmniWorld的大规模多领域多模态数据集,旨在解决4D世界建模领域高质量数据不足的问题,并通过实验证明该数据集能显著提升现有方法在4D重建和视频生成任务上的性能。
CognitiveSky:去中心化社交媒体的可扩展情感与叙事分析框架 / CognitiveSky: Scalable Sentiment and Narrative Analysis for Decentralized Social Media
这篇论文提出了一个名为CognitiveSky的开源框架,它能够高效分析去中心化社交媒体上的用户情感和话题叙事,并通过可视化工具帮助研究者低成本地追踪公众舆论动态。
PersonaX:包含LLM推断行为特征的多模态数据集 / PersonaX: Multimodal Datasets with LLM-Inferred Behavior Traits
这篇论文提出了一个名为PersonaX的多模态数据集,它结合了大型语言模型推断的行为特征、面部图像和传记信息,为跨模态行为分析和因果推理研究提供了基础。
InternScenes:一个具有真实布局的大规模可模拟室内场景数据集 / InternScenes: A Large-scale Simulatable Indoor Scene Dataset with Realistic Layouts
这篇论文提出了一个名为InternScenes的大规模可模拟室内场景数据集,它通过整合多种来源的场景数据并保留大量小物品,解决了现有数据集在规模、多样性和布局真实性方面的不足,为具身AI任务如场景生成和导航提供了更复杂和真实的训练环境。
SearchInstruct:通过基于检索的指令数据集创建增强领域适应性 / SearchInstruct: Enhancing Domain Adaptation via Retrieval-Based Instruction Dataset Creation
这篇论文提出了一种名为SearchInstruct的创新方法,它利用少量人工问题和大型语言模型自动扩展问题,并结合检索相关领域资源来生成高质量指令数据集,从而有效提升大语言模型在特定领域的适应性和性能。
Struct-Bench:差分隐私结构化文本生成的基准测试 / Struct-Bench: A Benchmark for Differentially Private Structured Text Generation
这篇论文提出了一个名为Struct-Bench的基准测试框架,用于评估包含自然语言的结构化数据在差分隐私保护下的生成质量,解决了现有方法难以衡量数据结构特性和相关性的问题,并为研究者提供了标准化的评估平台。
CMHG:中国少数民族语言标题生成数据集与基准 / CMHG: A Dataset and Benchmark for Headline Generation of Minority Languages in China
该研究创建了一个专门用于中国少数民族语言(如藏语、维吾尔语和蒙古语)标题生成任务的数据集和评估基准,以解决因文字系统差异导致的数据稀缺问题。
请先 登录 后再提交论文