arXiv最新AI论文速览速学

🔍

标签: #instruction tuning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: SAHM: A Benchmark for Arabic Financial and Shari'ah-Compliant Reasoning 04-26

arXiv ID: 2604.19098

arXiv 提交日期: 2026-04-21

natural language processing benchmark financial arabic financial nlp shari'ah reasoning instruction tuning

SAHM：一个面向阿拉伯语金融及伊斯兰教法合规推理的基准数据集 / SAHM: A Benchmark for Arabic Financial and Shari'ah-Compliant Reasoning

1️⃣ 一句话总结

该论文构建了首个针对阿拉伯语金融和伊斯兰教法合规推理的多任务基准数据集SAHM，包含1.4万条经专家验证的样本，并测试了19个大型语言模型，发现模型虽擅长候选识别，但在生成和因果推理任务上表现薄弱，尤其在事件因果推理方面差距最大。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19292

arXiv 提交日期: 2026-04-21

llm natural language processing evaluation multilingual bias benchmark locale ambiguity instruction tuning

位置未找到：揭示多语言大模型中的隐式本地与全局偏见 / Location Not Found: Exposing Implicit Local and Global Biases in Multilingual LLMs

1️⃣ 一句话总结

这项研究通过构建一个包含12种语言、2156个地域模糊问题的测试集（LocQA），系统性地发现多语言大模型存在两种结构性偏见：全球层面偏向美国相关答案（且指令微调会加剧这种偏见），以及同一语言内偏向人口较多的地区。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18041

arXiv 提交日期: 2026-04-20

llm natural language processing model training personalization judicial reasoning instruction tuning low-resource parameter-efficient fine-tuning

JudgeMeNot：个性化大语言模型以模拟希伯来语司法推理 / JudgeMeNot: Personalizing Large Language Models to Emulate Judicial Reasoning in Hebrew

1️⃣ 一句话总结

这篇论文提出了一种结合合成与有机监督的方法，能够高效地利用少量数据，将大语言模型个性化定制成能模仿特定法官在希伯来语环境下的司法推理风格，其生成结果与真实法官的推理难以区分。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.14016

arXiv 提交日期: 2026-04-15

multi-modal model training machine learning continual learning instruction tuning model merging catastrophic forgetting multimodal llms

MAny：面向多模态持续指令微调的通用融合框架 / MAny: Merge Anything for Multimodal Continual Instruction Tuning

1️⃣ 一句话总结

本文提出了一个名为MAny的训练后通用融合框架，它通过高效地合并不同任务中学到的视觉和语言知识，有效解决了多模态大模型在持续学习新任务时出现的‘感知漂移’和‘推理崩溃’双重遗忘问题，显著提升了模型的最终性能和稳定性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.08212

arXiv 提交日期: 2026-04-09

computer vision multi-modal systems vision-language models infrastructure inspection domain adaptation instruction tuning pavement assessment

用于全面自动化路面状况评估的视觉-语言基础模型 / Vision-Language Foundation Models for Comprehensive Automated Pavement Condition Assessment

1️⃣ 一句话总结

这篇论文通过构建一个大型专业路面数据集并训练一个名为PaveGPT的模型，成功地将通用视觉语言模型改造为能理解工程术语、进行结构化推理并输出符合行业标准的专业路面评估助手，从而用一个对话式工具替代了多个传统专业系统。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.24037

arXiv 提交日期: 2026-03-25

multi-modal model evaluation computer vision aesthetic assessment advertising images multimodal llm benchmark instruction tuning

A^3：面向广告美学评估的框架 / A^3: Towards Advertising Aesthetic Assessment

1️⃣ 一句话总结

这篇论文提出了一个名为A^3的综合性框架，通过理论驱动的评估范式、大规模数据集、多模态大语言模型和基准测试，旨在客观、可解释地自动评估广告图像的美学质量，以解决当前依赖主观判断的局限性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.14951

arXiv 提交日期: 2026-03-16

multi-modal model evaluation natural language processing point cloud quality assessment multimodal llm instruction tuning geometry-texture decoupling low-rank adaptation

GT-PCQA：一种基于多模态大语言模型的、几何与纹理解耦的点云质量评估方法 / GT-PCQA: Geometry-Texture Decoupled Point Cloud Quality Assessment with MLLM

1️⃣ 一句话总结

本文提出了一种名为GT-PCQA的新方法，它通过结合2D-3D联合训练和几何纹理解耦策略，成功利用多模态大语言模型来准确评估点云质量，解决了现有方法因数据不足和模型偏重纹理而忽略几何结构缺陷的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.14941

arXiv 提交日期: 2026-03-16

multi-modal computer vision model training remote sensing world model spatiotemporal forecasting instruction tuning generative pre-training

RS-WorldModel：一个用于遥感理解与未来场景预测的统一模型 / RS-WorldModel: a Unified Model for Remote Sensing Understanding and Future Sense Forecasting

1️⃣ 一句话总结

这篇论文提出了一个名为RS-WorldModel的统一模型，它能够同时理解遥感图像的变化并预测未来的场景，通过创新的三阶段训练方法，在参数规模远小于其他模型的情况下，在多项任务上超越了现有的大型开源甚至部分闭源模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.14723

arXiv 提交日期: 2026-03-16

llm model training model evaluation safety fine-tuning lora harmbench refusal behavior instruction tuning

超越信条：一种非身份安全条件——低数据LoRA微调中身份框架的强有力实证替代方案 / Beyond Creed: A Non-Identity Safety Condition A Strong Empirical Alternative to Identity Framing in Low-Data LoRA Fine-Tuning

1️⃣ 一句话总结

这篇论文通过实验发现，在提升AI模型安全性的微调过程中，使用不强调AI身份的普通规则说明，比刻意强调AI身份（如“我是一个无害的AI”）的“信条式”框架效果更好，且不影响模型的其他能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15237

arXiv 提交日期: 2026-03-16

multi-modal computer vision model training vision-language models anomaly detection physics-informed instruction tuning causal reasoning

用于物理基础异常检测的多轮物理信息视觉语言模型 / Multi-turn Physics-informed Vision-language Model for Physics-grounded Anomaly Detection

1️⃣ 一句话总结

这项研究通过在多轮对话中融入物体属性、运动规律等物理知识，显著提升了通用视觉语言模型在检测违反物理规律的动态异常（如不规则旋转）方面的能力，使其性能远超现有最佳方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.19098

1️⃣ 一句话总结

arXiv ID: 2604.19292

1️⃣ 一句话总结

arXiv ID: 2604.18041

1️⃣ 一句话总结

arXiv ID: 2604.14016

1️⃣ 一句话总结

arXiv ID: 2604.08212

1️⃣ 一句话总结

arXiv ID: 2603.24037

1️⃣ 一句话总结

arXiv ID: 2603.14951

1️⃣ 一句话总结

arXiv ID: 2603.14941

1️⃣ 一句话总结

arXiv ID: 2603.14723

1️⃣ 一句话总结

arXiv ID: 2603.15237

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.19098 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19292 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18041 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.14016 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.08212 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.24037 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.14951 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.14941 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.14723 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15237 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.19098

arXiv ID: 2604.19292

arXiv ID: 2604.18041

arXiv ID: 2604.14016

arXiv ID: 2604.08212

arXiv ID: 2603.24037

arXiv ID: 2603.14951

arXiv ID: 2603.14941

arXiv ID: 2603.14723

arXiv ID: 2603.15237