您好,欢迎来到佳博论文网!

一种基于视觉的网页分割技术及应用研究

论文摘要

CNNIC第33次中国互联网络发展状况统计报告显示,仅5年时间,手机网民由1.78亿猛增至5亿人,占总体网民81.0%,并保持稳定增长趋势,由此可知手机网民已成为稳定增长的庞大用户群体。而手机屏幕尺寸和运算能力的局限性,导致手机浏览器无法正常呈现、甚至无法打开针对PC设计的Web网页。随着微电子技术与移动通信技术的迅速发展,该矛盾日益突出和尖锐。针对该问题,提出VWS技术,以解决手机浏览器无法准确、高效地显示Web网页问题,从而提高用户体验。VWS技术从视觉角度标识网页中内容块的特征,之后基于最优化理论,把网页分割看作分组最优化问题,将网页分割为语义完整且适合手机显示的子页网。最后,选取特定子页作为首页推送给用户,用户可根据需要切换浏览各子页。该技术创新地提出网页预处理算法,将网页内容与样式信息进行融合,实现样式信息充分、高效地利用;创新地依据人类视觉特征从六个维度描述内容块视觉特征,并定义内容块在视觉特征方面的相似度计算公式,之后设计神经网络直接确定公式中每个维度的权值,此权值直接确定法较专家经验法真实、客观,比传统神经网络权值确定法高效、逼真;创新地将网页分割看作分组最优化问题,并基于最优化理论中的Kruskal算法设计网页分割算法。在确保手机正常显示的前提下,实现各子页中内容块间的相似度最大化,提高了各子页中内容块间的语义的相关性与完整性。ECs中含优质数字化学习资源高达125.64万,随着非正式学习理论在我国迅速流行加之手机的便捷性,越来越多的学习者希望通过手机访问ECs网页。因此,可以将VWS技术应用于ECs中,并以ECs为实验对象验证VWS技术的可行性,借此解决ECs网页在手机浏览器中的显示问题,增加ECs的访问渠道,从而促进精品课程的建设与发展。实验中随机选取100个不同的ECs网站,在每个网站中随机获取一个网页,采用VWS技术与VIPS技术分割得到的100个ECs网页,并对分割结果进行定性实验与定量实验。分析结果表明,VWS技术可出色地完成Web网页分割,实现针对PC端设计的网页在手机中的正常显示,并且具有较好的用户体验。