




kok电子竞技权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
kok电子竞技:文档简介
1、信息检索:考试时,试题序号和答案序号要随机变化。1、(单。4分)网页重定向属于下列哪种作弊方式(C)A、内容作弊 B、Web2.0 作弊C I C、链接作弊"D、隐藏作弊2、(单。4分)以下关于网络爬虫的描述中,错误的一项是()J A、对于商业搜索引擎来说,分布式爬虫是必须采用的技术匚B、根据某种抓取策略爬行新发现的URL,如此重复下去 C、在爬虫开始的时候,需要给爬虫输送一个URL列表,作为爬虫的起始位置*D、爬虫程序会抓取所有网页,以保证搜索正确性3、(单。4分)在实际的搜索引擎系统中,通过存储()来存储文档信息 A、文档编号"B、文档简化序号口 C、文档编号差值
2、匚D、文档地址从商家角度看,推荐系统受欢迎的原因有()" A、可以增加用户信任度和粘性,增加营收 B、可以帮助用户发现喜欢的新事物广 C、可以增强用户体验 D、拓宽了用户获取知识的方式5、(单。4分)对网页进行两次抓。谝淮问钦5乃阉饕媾莱孀ト。诙次以模拟人工访问页面的方式抓。绻酱巫ト〉降哪谌莶钜旖洗,则认为是作弊页面,这属于() A、识别页面隐藏厂 B、识别网页重定向仔 C、反内容作弊O D、链接反作弊6、(单。4分)关于HITS算法描述正确的是(C)" A、算法最后输出的是按照内容权威度排序的结果列表O B、如果在原有的扩展网页集合内添加删除个别网页或
3、者改变少数链接关系,HITS算法的排名结果不会有非常大的改变匚C、HITS算法核心思想是对网页两个方面的权威程度进行评价,一个是内容权威度,另一个是链接权威度,两者具有相互增强的关系 D、HITS是与查询相关的算法,计算效率较高在向量模型中,不可以通过()来衡量文档和查询之间的相似度。"A、向量内积 B、向量间正切值广 C、向量间距离 D、向量间夹角大小8、(单。4分)针对用户冷启动问题,下列选项中做法错误的是()A、引导用户勾选感兴趣的标签B、利用用户的人口统计学信息" C、利用用户手机中其它应用的日志文件分析用户的兴趣点UD d、推荐热门商品9、(单。4分)关于Pa
4、geRank标准算法与简化算法正确的是()A A、PageRank标准算法不考虑没有超链接网页的情况B IIB、PageRank简化算法可以保证迭代过程中的PageRank值之和为1 C、PageRank简化算法对 G中的每一个节点n ,设定其初始值均为 1/n"D、在实际运算过程中,由于节点数 n的值巨大,因此通常采用适用于稀疏矩阵运算的PageRank标准算法来对运算过程进行改善10、(单。4分)下列关于基于用户的协同过滤算法的说法中,错误的是()*A、基于用户的协同过滤算法相对于基于物品的协同过滤算法来说更个性化,反映了用户自己的兴趣传承广 B、新用户刚加入系统时, 基于用户
5、的协同过滤算法没有办法马上对该用户进行个性化推荐 C、随着网站的用户数目越来越大,计算用户兴趣相似度矩阵将越来越困难 D、基于用户的协同过滤算法可以使用余弦相似度来评测两个用户之间的联系11、(单。4分)信息检索模型中,神经网络模型属于()A、结构化模型B_J B、向量模型 C、概率模型 D、布尔模型12、(单。4分)所有检索策略都包含三个要素,以下选项中不属于三要素的一项是()" A、排序函数广 B、文档表示T c、 匹配函数C IID、查询表示13、(单。4分)下面方法中,不是建立索引的方法的是()厂 A、归并法1 B、 两边文档遍历法仔 C、HITS D、排序法14、(单
6、。4分)以下选项中描述不正确的是() A、倒排列表是指记载出现过某个单词的所有文档的文档列表、以及单词在该文档中出现的位置信息 B、爬虫的作用是为搜索引擎抓取大量的数据,抓取的对象是整个互联网上的网页 C、暗网是一些垂直领域网站,它们通常是网站提供组合查询界面,用户按照需求输入查询之后,才能获取相关数据1V D、根据具体应用的不同,可以将爬虫分为两种类型,即增量型爬虫和垂直型爬虫15、(单。4分)下列关于推荐算法的说法中,错误的是() A、隐语义模型很难实现实时推荐 B、基于物品的协同过滤算法着重于维护用户的历史兴趣广 C、基于用户的协同过滤算法更社会化,着重于反映和用户兴趣相似的小群体的
7、热点UD、使用基于内容的推荐算法进行个性化推荐时,由于非结构化特征难以利用,我们通常直接将其舍弃16、(单。4分)以下不是搜索引擎的主要功能模块的一项是()A、搜索引擎索引B、网络爬虫C、 PageRankD、搜索排序17、(单。4分)以下选项中描述正确的是()A、中文分词技术采用了基于符号的方法来识别B、查准率是衡量系统在实施某一作业时检出相关文献能力的一种测度指标,是对检索遗漏程度的度量。C、机器学习的四个步骤中,文档特征抽取是指利用抽取算法抽取查询词TF/IDF 信息、文档长度、网页 PageRank值、网页入链/出链数量等D、动态索引包含2个关键的索引结构:倒排索引、临时索引提示:
8、请选择答案。18、(单。4分)T1、T2、T3表示特征项,D1、D2、D3、D4为文档向量, Q为查询向量,其中,D1=4T1+2T2+3T3 , D2=T1+4T2+2T3 , D3=5T1+2T3 , D4= T2+3T3 , Q=T1+0T2+2T3以上文档中和 Q最大可能相关的是()A、D3B、D2C、D4D、D1下列选项中是显性反馈数据的是()A、 用户在某个视频的停留时长广 B、用户观看了某个视频C IIC、用户对某个视频的评分 D、用户观看视频的日志20、(单。4分)下列关于推荐系统评测中在线实验的说法,错误的是()O A、周期较长,需要进行长期的实验才能得到可靠的结果 B、
9、可以公平获得不同算法实际在线时的性能指标 C、可以获得商业上关注的指标,如转化率、点击率等, D 、成本较低,容易部署21、(单。4分)以下关于推荐系统和搜索引擎的说法中,错误的是() A、推荐系统和搜索引擎都是为了解决信息过载的问题 B、搜索引擎需要用户提供明确的需求C、搜索引擎注重结果之间的排序, D 、推荐系统是由用户主导的22、(单。4分)以下选项中属于概率模型的优点的是()0 A、模型中所有的权值都是二值的 B、模型最初将文档分成相关的集合和不相关的集合C IIC、模型具有内在的相关反馈机制,将文档根据相关概率按递减顺序排列 D、模型假设标引词相互独立23、(单。4分)下列选项中不是冷启动问题解决方案的是()M A、推荐冷门物品给用户B、请专家对商品进行标注C、推荐热门商品给新用户OD、雇佣少量用户试用新商品并给出评分24、(单。4分)为了覆盖用户的不同兴趣领域,我们需要提高推荐结果的()Q A、多样性UD B、满意度IIC、惊喜度 D、准确率25、(单。4分)下列各项中为工业界更关注的评测指标的是()r ,-A、点击率B、新颖性r 一C、惊昌度D、准确率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
kok电子竞技:最新文档
- 存量房买卖合同修订
- 三农田水利设施防洪抗旱方案
- 交通行业车辆排放标准比较表
- 防灾减灾活动方案
- 放飞心中的梦想主题班会方案
- 2024年氯甲烷项目投资申请kok电子竞技代可行性研究kok电子竞技
- 2025届湖南省交通规划勘察设计院有限公司校园招聘34人笔试参考题库附带答案详解
- 2024-2025学年第二学期天域全国名校协作体高三3月联考 语文试卷(含答案)
- 2025宁夏宁鲁石化有限公司招聘40人笔试参考题库附带答案详解
- 2025年上半年宜昌猇亭区城管协管员招考易考易错模拟试题(共500题)试卷后附参考答案
- 2024年湖南环境生物职业技术学院高职单招职业技能测验历年参考题库(频考kok电子竞技)含答案解析
- 后循环缺血治疗
- 2024年浙江绍兴杭绍临空示范区开发集团有限公司招聘笔试真题
- 2025年体检科医疗质量控制工作计划
- 2025年河南中烟工业限责任公司大学生招聘笔试高频重点提升(共500题)附带答案详解
- 农村土地流转合同范本
- 无人机法律法规与安全飞行 第2kok电子竞技2-2 领空
- 道德与法治研修日志
- 2023年佛山市三水区乐平镇镇属国有企业招聘笔试真题
- 《单片机应用实训教程》课件第4章
- 品管圈PDCA改善案例-降低高危患者夜间如厕跌倒发生率
评论
0/150
提交评论