数学公式排序算法,-初步探讨,排序要解决的问题,1. 用户查询公式与文档中公式的相关度(匹配程度)。 2. 文档本身质量的衡量,搜索过程中存在的问题,1. a+b 和 b+a 应该都要返回 2. x+y 和 a+b 等价公式不同变量标示符的返回 3. 完全匹配和部分匹配的如何返回?,一、数学公式的特点,1. 数学公式组成 数学公式主要由运算关系、运算、运算因子、标准函数(普通函数不含在内)、边界符等特征项构成。 运算关系包括:大于、小于、等于、约等于等等; 运算包括:求和、求商、求积、求积分、求微分、求解、各种变换(拉式变换)等; 运算因子:指要进行某种运算的数学表达式。运算因子可以分解,并包括特殊运算因子,如:矩阵、向量、数列等; 标准函数:高等数学中定义的标准函数,包括三角函数、反三角函数、对数函数等等; 边界符:指揭示运算逻辑关系或运算层级关系的符号,如大括号、中括号、括号等等。 变量标识符,对于以上特征除变量标识符和常量之外,其余都是有限的可以统计的。 数学公式的精髓:要表达的某种运算,运算是数学公式的关键特征。表征运算的符号 重要性 大于表征参与运算的变量和常量。 eg.