arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 85 72小时内新更新论文 72h更新 162 最新: PRISM: Breaking the O(n) Memory Wall in Long-Context LLM Inference via O(1) Photonic Block Selection 03-24

arXiv ID: 2602.04043

arXiv 提交日期: 2026-02-03

computer vision aigc model training 3d reconstruction 3d gaussian splatting multimodal stylization feed-forward zero-shot

AnyStyle：面向3D高斯泼溅的单次多模态风格化方法 / AnyStyle: Single-Pass Multimodal Stylization for 3D Gaussian Splatting

1️⃣ 一句话总结

这篇论文提出了一个名为AnyStyle的前馈式3D重建与风格化框架，它能够仅通过一次处理，就利用文本描述或参考图片等不同模态的输入，为3D高斯泼溅模型实现无需特定拍摄姿态的、高质量的零样本风格化控制。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03582

arXiv 提交日期: 2026-02-03

machine learning model training systems inverse design aerodynamic optimization guided generation covariance estimation physics-based simulation

空气动力学逆设计中的优化与生成 / Optimization and Generation in Aerodynamics Inverse Design

1️⃣ 一句话总结

这篇论文提出了一种新的方法，通过改进预测器训练和优化算法，在空气动力学形状设计中同时提升优化效率和生成质量，并在汽车和飞机等复杂三维模型上验证了其有效性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03655

arXiv 提交日期: 2026-02-03

theory model training machine learning group theory sequence learning network depth representation learning theoretical analysis

序列群组合：窥探深度学习机制的一扇窗 / Sequential Group Composition: A Window into the Mechanics of Deep Learning

1️⃣ 一句话总结

这篇论文通过设计一个名为‘序列群组合’的数学任务，揭示了不同深度神经网络（如浅层网络、循环网络和多层网络）在处理序列数据时，如何利用群的结构和运算的关联性来高效学习，从而为理解深度学习的内部工作机制提供了一个可分析的理论模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03546

arXiv 提交日期: 2026-02-03

systems model training machine learning analog computing local learning equilibrium propagation gradient calculation resistor networks

如何训练你的电阻网络：广义平衡传播与解析学习 / How to Train Your Resistive Network: Generalized Equilibrium Propagation and Analytical Learning

1️⃣ 一句话总结

这篇论文提出了一种新的算法，能够精确计算模拟电阻网络的梯度，从而在满足物理系统局部性约束的条件下，高效地训练这些用于节能机器学习的硬件系统。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03737

arXiv 提交日期: 2026-02-03

machine learning systems model training soft sensor lstm transfer learning time series oil and gas

基于长短期记忆与迁移学习的石油井底压力估计软测量方法 / Soft Sensor for Bottom-Hole Pressure Estimation in Petroleum Wells Using Long Short-Term Memory and Transfer Learning

1️⃣ 一句话总结

这项研究提出了一种利用井口和地面测量数据、结合长短期记忆网络与迁移学习技术的软测量方法，能够以低于2%的平均绝对百分比误差准确估算石油井的流动井底压力，为替代昂贵且易损的物理传感器提供了一种低成本、高精度的解决方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04901

arXiv 提交日期: 2026-02-03

biology machine learning model training gene perturbation prediction single-cell genomics structured representation learning conditional flow matching gene program coordination

超越独立基因：用于基因扰动预测的模块归纳表征学习 / Beyond Independent Genes: Learning Module-Inductive Representations for Gene Perturbation Prediction

1️⃣ 一句话总结

这篇论文提出了一个名为scBIG的新方法，它通过识别和建模基因之间协同工作的‘功能模块’，而非孤立地看待每个基因，从而更准确地预测基因被干扰后细胞内的整体变化，尤其在预测新组合或未见过的干扰时表现更优。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03230

arXiv 提交日期: 2026-02-03

multi-modal computer vision model training event-based vision multimodal llm spatiotemporal sparsity efficient inference instruction tuning

EventFlash：迈向高效的事件视觉多模态大语言模型 / EventFlash: Towards Efficient MLLMs for Event-Based Vision

1️⃣ 一句话总结

这篇论文提出了一种名为EventFlash的高效新模型，它通过智能压缩事件流数据中的冗余时空信息，在保持良好感知能力的同时，大幅提升了事件视觉大模型的运行速度，使其更适合处理高速、弱光场景下的长序列任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03297

arXiv 提交日期: 2026-02-03

model training theory machine learning deep equilibrium models fixed-point convergence lipschitz constraint computational efficiency image classification

Lipschitz多尺度深度平衡模型：一种理论保证且加速的方法 / Lipschitz Multiscale Deep Equilibrium Models: A Theoretically Guaranteed and Accelerated Approach

1️⃣ 一句话总结

这篇论文提出了一种改进的深度平衡模型，通过引入Lipschitz多尺度结构和调整超参数，在理论上保证了模型前向和反向传播中不动点迭代的收敛性，从而在图像分类任务上显著提升了计算速度，仅以微小的精度损失为代价。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03223

arXiv 提交日期: 2026-02-03

machine learning model training data ctr prediction numerical embedding streaming features distribution estimation online learning

面向流式数值特征的分布感知端到端嵌入方法，用于点击率预测 / Distribution-Aware End-to-End Embedding for Streaming Numerical Features in Click-Through Rate Prediction

1️⃣ 一句话总结

本文提出了一种名为DAES的新方法，它能够在线学习（流式训练）场景下，有效地将数值特征的分布信息融入点击率预测模型，从而显著提升预测准确性，并已成功应用于一个拥有数亿日活用户的短视频平台。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03203

arXiv 提交日期: 2026-02-03

llm model training systems kv cache eviction policy reasoning models memory optimization reinforcement learning

ForesightKV：通过学习长期贡献优化推理模型的KV缓存淘汰机制 / ForesightKV: Optimizing KV Cache Eviction for Reasoning Models by Learning Long-Term Contribution

1️⃣ 一句话总结

这篇论文提出了一个名为ForesightKV的智能缓存管理框架，它通过结合监督学习和强化学习来预测并淘汰推理过程中不重要的中间数据，从而在只使用一半缓存的情况下，显著提升大语言模型处理长文本时的效率和性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.04043

1️⃣ 一句话总结

arXiv ID: 2602.03582

1️⃣ 一句话总结

arXiv ID: 2602.03655

1️⃣ 一句话总结

arXiv ID: 2602.03546

1️⃣ 一句话总结

arXiv ID: 2602.03737

1️⃣ 一句话总结

arXiv ID: 2602.04901

1️⃣ 一句话总结

arXiv ID: 2602.03230

1️⃣ 一句话总结

arXiv ID: 2602.03297

1️⃣ 一句话总结

arXiv ID: 2602.03223

1️⃣ 一句话总结

arXiv ID: 2602.03203

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.04043 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03582 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03655 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03546 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03737 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04901 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03230 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03297 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03223 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03203 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.04043

arXiv ID: 2602.03582

arXiv ID: 2602.03655

arXiv ID: 2602.03546

arXiv ID: 2602.03737

arXiv ID: 2602.04901

arXiv ID: 2602.03230

arXiv ID: 2602.03297

arXiv ID: 2602.03223

arXiv ID: 2602.03203