1、人工智能导论,中国计量大学现代科技学院2016/2017 Sem 1,Marks Division,10% Attendance/Class Participation40% Assignments20% written homework/coursework20% programming assignments.50% Programming Project/Exam,Course Overview,Knowledge Expression (知识表示)Logic Implication (逻辑推理)Uncertainty Expression (不确定性表示)Searching (搜索)G
2、enetic Algorithm (遗传算法)Neural Networks (神经网络)Machine Learning (机器学习)Expert System (专家系统)Natural Language Processing (自然语言理解及其应用),人工智能的基本概念,目标:用机器实现人类的部分智能然而,什么是智能?- 并没有确切定义智能的发生、物质的本质、宇宙的起源和生命的本质 自然界的四大奥秘科学家们根据对人脑的已有认识、结合智能的外在表现,从不同角度,不同侧面用不同的方法对智能进行研究,并提出了三种基础理论:,思维理论,认为智能的核心是思维人的一切只能都来自大脑的思维活动人类的一
3、切知识都是人类思维的产物通过对思维规律与方法的研究有望揭示智能的本质,知识阈值理论,认为智能行为取决于知识的数量和其泛化程度一个系统之所以有智能是因为他具有可运用的知识因此,知识阈值理论将智能定义为:在数据库中搜索一个满意解的能力。,进化理论,进化理论认为人的智能是一种特立独行的能力。具体表现为在动态环境中的行走能力,对外界的感知能力,维持生命以及繁衍生息的能力。该理论的核心是用控制代替表示,从而取消概念、模型以及显示表示的知识,否定抽象对于智能的重要性,强调分层结构对于智能进化的重要性。,智能的特性,具有感知能力包括视觉嗅觉等等,能够感知外部信息。具有记忆和思维能力思维:逻辑思维形象思维顿悟
4、思维具有学习能力具有行为能力,What is AI?,Views of AI fall into four categories:Thinking humanly Thinking rationallyActing humanly Acting rationally,Acting humanly: Turing Test,Turing (1950) Computing machinery and intelligence:Can machines think? Can machines behave intelligently?Operational test for intelligent
5、behavior: the Imitation GamePredicted that by 2020, a machine might have a 50% chance of fooling a lay person for 30 minutes,人工智能的主要研究领域,自然语言理解计算机能够正确理解人们用自然语言输入的信息对输入信息,计算机能够产生相应的摘要,能用不同的词语复述输入信息的内容计算机能够用某一种自然语言表示的信息翻译成另一种自然语言的相同信息,人工智能的主要研究领域,博弈五子棋象棋围棋接龙梭哈21点斗地主,人工智能的主要研究领域,模式识别在计算机视觉方面的应用人脸识别手势识别
6、步态识别二维图像识别三维物体识别,人工智能的主要研究领域,智能控制智能管理和智能决策专家系统系统查错与纠错智能家居智能汽车,人工智能的主要研究领域,智能预测温度预测气压预测湿度预测耗电量预测好评度预测票房预测股票预测,自然语言处理 Natural Language Processing (NLP),Main steps of NLP,Input:Voice recognition(out of scope)Understanding the inputPartitioning the sentence (noun, verb, subjective, objective)Searching f
7、or the meaning in databaseLooking for answerSearching for appropriate answer related to the input,自然语言处理的功能,回答问题(Question Answering):能够用正确的自然语言回答有关问题文摘生成:输入文本的摘要解释翻译,自然语言处理的主要方法,关键字匹配句法-语义分析技术Knowledge-based NLPNLP based on big data,Syntax Parse Trees,Knowledge based NLP,Searching each word in the d
8、atabaseLooking for matching and classificationLooking for corresponding answers,汉字分词法,最大匹配法在待切分文本中,按自左到右的顺序截取一个定长的字符串,通常为6到8个汉字(我们称之为最大词长)去计算机数据库中搜索匹配,如果匹配不成功,则从右向左逐次减去一个汉字。逆向最大匹配法和最大匹配法相似,不过截取顺序改为自右向左逐字遍历匹配法,对输入文字进行归类,Input,Classifier,Location,Time,Greeting,Food,Unknown,最简单的人工智能QA系统,问时间:回答系统时间问地点:回
9、答GPS位置问好:问好问吃的:找最近的餐厅位置。未知:I dont know.,更加智能的QA系统,进化版QA系统需要预测人们问问题时的真实想法。利用历史数据并引入机器学习概念。譬如我发现小Y所有迟到的日子基本都是星期五,而在非星期五情况下他基本不迟到。于是我可以建立一个模型,来模拟小Y迟到与否跟日子是否是星期五的概率。,机器学习,当系统被提问今天小Y是否迟到时,系统能做出更加准确的判断。,机器学习,随机过程 称为马尔可夫链,若它只取有限或可列个值(称为过程的状态,记为0,1,2,),并且,对任意 及状态 ,有,马尔可夫链的定义,例(马尔可夫预测)某种鲜奶A改变了广告方式,经调查发现购买A种鲜
10、奶及另外三种鲜奶B、C、D的顾客每两个月的平均转换率为:(假设市场上只有这4种鲜奶) A A(95%) B(2%) C(2%) D(1%) B A(30%) B(60%)C(6%) D(4%) C A(20%) B(10%)C(7%) D(0%) D A(20%) B(20%)C(10%) D(50%)假设目前购买A、B、C、D 4种鲜奶的顾客的分布为(25%,30%,35%,10%),求半年后鲜奶A、B、C、D的市场份额。,解 一阶转移矩阵为,初始分布为,则,半年后A种鲜奶的市场占有率为,解,例,隐马尔可夫模型(Hidden Markov Model (HMM)),HMM(隐马尔可夫模型)是
11、用来描述隐含未知参数的统计模型,举一个经典的例子:一个东京的朋友每天根据天气下雨,天晴决定当天的活动公园散步,购 物,清理房间中的一种,我每天只能在twitter上看到她发的推“啊,我前天公园散步、昨天购物、今天清理房间了!”那么我可以根据她发的推特推断 东京这三天的天气。,隐马尔可夫模型(Hidden Markov Model (HMM)),隐马尔可夫模型(Hidden Markov Model (HMM)),代码,states = (Rainy, Sunny) observations = (walk, shop, clean) start_probability = Rainy: 0.6
12、, Sunny: 0.4 transition_probability = Rainy : Rainy: 0.7, Sunny: 0.3, Sunny : Rainy: 0.4, Sunny: 0.6, emission_probability = Rainy : walk: 0.1, shop: 0.4, clean: 0.5, Sunny : walk: 0.6, shop: 0.3, clean: 0.1, ,求解最可能的天气,因为第一天我的朋友去散步了,所以第一天下雨的概率V第一天下雨 = 初始概率下雨 * 发射概率下雨散步 = 0.6 * 0.1 = 0.06,同理可得V第一天天晴 = 0.24 。从直觉上来看,因为第一天朋友出门了,她一般喜欢在天晴的时候散步,所以第一天天晴的概率比较大。,求解最可能的天气,从第二天开始,对于每种天气Y,都有前一天天气是X的概率 * X转移到Y的概率 * Y天气下朋友进行这天这种活动的概率。因为前一天天气X有两种可能,所以Y的概率有两个。,求解最可能的天气,答案:【S, R, R】,隐马尔可夫模型的作用,从已知(表象)状态来推测隐含状态。假如后来我们被告知实际天气,如何来调整原始数据(probabilities)?,