APP下载

基于文本挖掘的网络信息搜索目标预测系统

2022-03-15张伟

电子设计工程 2022年5期
关键词:采集器处理器芯片

张伟

(南京同仁医院 信息部,江苏南京 211102)

随着互联网技术的不断发展,互联网应用逐渐得到普及,根据网络用户浏览记录预测用户兴趣强度,从而推送带有特定目标的网络信息,目标定位在预测用户兴趣强度过程中起到了关键的作用,它需要确定网络信息目标的种类,从而识别网络信息目标的准确位置[1-2]。

目前,互联网更新网络信息的速度较快,丰富的网络信息给人们日常生活带来了很多便利,但是网络用户搜索的信息内容产生了不协调信息,该信息的出现给网络信息目标的正常预测造成了严重的影响,因此,需要及时、准确地预测出网络信息目标路径[3-5]。

传统的预测系统在预测网络信息搜索目标时,预测信息目标不准确,预测效果较差,绘制的搜索目标路径与真实目标路径相差较大,目标定位无法准确识别出网络信息搜索目标的位置。

基于以上传统预测系统出现的问题,文中设计了一种基于文本挖掘的网络信息搜索目标预测系统,该系统采用了文本挖掘技术,能够从海量的网络信息中挖掘出潜在的、有利用价值的目标数据,与此同时,该预测系统详细设计了硬件和软件,最后通过实验验证了所设计的基于文本挖掘的网络信息搜索目标预测系统的有效性。

1 系统硬件设计

随着计算机网络的不断发展,网络信息的种类越来越多,所以文中在结合多个传统预测系统硬件的基础上,设计了一个全新的硬件系统,系统硬件架构如图1 所示。

图1 系统硬件架构

由图1 可知,系统硬件架构的主要核心器件包括采集器、处理器、存储器和传输器。

1.1 采集器设计

文中预测系统的采集器芯片内部含有2 路输出信号、1.8 V 的外围电压基准和一个8 位的串行接口。芯片在采集网络数据时,功耗只有40 mW,当采集器处于节电模式时,芯片运行的功耗为20 μW,采集芯片内部还设置了多通道的选择器,可选择网络信息的不同目标路径,采集器外围设置了数据传输器,该传输器可以快速传输网络信息数据,传输速率最高可达到512 Mbps。由于采集器芯片功耗较低,所以采集器选择普通蓄电池为其供电,电压控制在1.8~3.3 V,电流为1.2~1.8 mA。当电压为1.8 V 时,由采集芯片对网络目标数据进行等间隔采样,并将采样结果通过高速并行接口传输到采集器的内部缓存器中,由内部缓存器完成数据缓存,并将数据打包,通过USB 接口将打包完的数据传输到主控计算机上进行数据处理[6-7]。该款采集器上还设置了4 路RS-232 接口,作用是将网络信息数据和搜索目标数据中转到主控机上。采集器内部结构如图2 所示。

图2 采集器内部结构

1.2 处理器设计

文中设计的处理器芯片选用TI 公司最新推出的TD172B23 芯片,该芯片处理网络数据的能力较强,芯片内部含有4 种处理器内核,分别为1A-2000、3A-4000、5A-5000 和7A-3000,这些处理器内核全都是以GS446 架构设计而成的,在设计GS446 架构时参考了其他品牌的处理器架构,与其他处理器架构相比设置了更多的参数[8-10]。处理器内部时钟芯片如图3 所示。

图3 处理器内部时钟芯片

处理器外围电路电压最高能达到4.8 V,最低为1.8 V,主要为处理器整个器件供电,外围电流最高为2.8 A,最低为1.2 A,在处理器处于节电模式时,电压和电流分别为2.2 V、1.4 A。该处理器定点和浮点的分值与其他处理器相比优势更大,在处理器正常工作状态下,需要系统内存和网络宽带对其进行辅助,在调试系统内存和网络宽带时,根据处理器的工作状态确定调试次数[11-12]。

1.3 存储器设计

文中预测系统的存储器芯片选择的是TU 公司生产的TDYEBI663 芯片,该芯片可以高效、快速地处理信息数据,功耗较低。存储器的存储原理是将缓存设置在主控机和存储单元之间,主控机访问速度与CPU 相比更慢,满足不了快速访问的要求,所以在存储器正常工作的情况下,不会访问主控机[13-14]。将采集器采集到的网络信息复制并粘贴在主存储器上,以便在下一次访问时可以直接访问主存储器,省略了访问CPU 的环节,这样的设计可以在一定程度上提升系统运行和存储速度。通过主存储器的存储容量判断CPU 的访问能力,存储器的结构如图4 所示。

图4 存储器结构

由图4 可知,文中设计的存储器主要以数字为单位,对采集到的网络数据进行存储,这样可以增加主存储器的存储空间,在交换网络不协调信息时,可以采用字块形式对不协调网络数据进行存储[15]。

1.4 传输器设计

预测系统的传输器芯片选择TD 公司生产的MT1860B 芯片,在传输网络信息数据时,传输介质使用4 类以上7 类以下的CAJ 总线,对网络图像信息、音频信息、视频信息、彩色图像和彩色视频信息进行实时传输,并且可分别与传输器的CPU、主传输器结合使用,三者结合使用的结果是产生不同的传输距离。与传输器的CPU 结合使用,传输距离可以达到1 400 m,与主传输器结合使用,传输距离可以达到1 600 m,根据网络信息的数量和不协调信息的种类调节发生器和接收器,将视频信号的传输距离调整到1 200~1 500 m,以满足实际传输的需要,使传输器的抗干扰能力达到最佳[16]。为了保证传输器的正常工作,传输器外围电路的电压最高为9.2 V,最低为3.3 V,电流最高为4.2 A,最低为1.2 A。传输器电路如图5 所示。

图5 传输器电路

2 系统软件设计

文本挖掘是指使用数据挖掘技术,从海量的文本数据中提取有利用价值的信息数据,这些信息数据与原始数据可能存在着内在联系和相似的发展趋势,并具有某种特定规律,从信息数据中可以抽取全新、可利用、有效的数据模式,利用这些全新的数据模式更高效地组织文本信息。文中设计的网络信息搜索目标预测系统采用了文本挖掘技术,利用文本挖掘中的文本摘要、结构分析和数据演变将网络用户搜索的信息内容进行系统分类,抽取网络信息中的不协调信息,对目标定位进行检索,帮助预测系统分析文本信息中的关键信息。

根据设计的基于文本挖掘的网络信息搜索目标预测系统硬件结构,文中对软件进行了设计,软件流程如图6 所示。

图6 系统软件流程

文中研究的基于文本挖掘的网络信息搜索目标预测系统软件流程主要通过以下3 方面来进行,具体步骤如下:

1)提取关键的网络信息。网络用户搜索的网络信息数量巨大,信息种类繁多且复杂,在传输时很容易混在一起,如果在某一时间段内同时进行预测,会极大地降低预测结果的效率,无法准确预测网络用户的真正需求。所以在预测网络信息搜索目标时,首先要提取关键的网络信息,采用聚类技术抽取目标掩码,识别候选框,对用户搜索的数据进行筛选和提取,更新抽取完的目标掩码,将更新结果放在文本信息中,降低提取的难度。由于网络的传输层具有较高的复杂性,为满足其需求,需要不断更新目标掩码,加强对网络的刷新,在对关键网络信息进行提取和分析时,需要实时记录提取和分析的时间,以完成设定的提取目标。

2)筛选目标信息。把网络信息搜索目标进行迭代分类,从而获得首次分类完的阶段性目标信息,如果目标信息中出现了不协调信息,则将不协调信息存放在候选框的右下角和左下角,如果目标信息中没有产生不协调信息,则利用迭代分类把首次信息筛选结果存放在候选框的左上角和右上角,在进行二次筛选时,把中心目标信息移动至候选框的边缘,以便随时对其进行最后一次的信息筛选。在最后筛选目标信息时,控制分类和筛选的时间,争取以最短的时间得到最终的目标信息,同时必须保证结果的准确性以及筛选的及时性。

3)得到用户搜索的网络信息。采用由粗到精的方式找到特定的网络信息,用户搜索的信息内容可分成多个方面,不同方面定位的角度不同,根据中心内容分析目标信息的边缘信息,中心目标信息在候选框的边缘进行移动时,会与边缘信息发生重叠,通过重叠信息可以精准预测目标信息的位置。传统软件在预测网络信息搜索目标时,只能采用基于密度的检测方法,文中通过迭代分类使不同方面的网络信息呈现松散状态,以提高网络信息搜索目标的准确性。

3 实验研究

为了验证基于文本挖掘的网络信息搜索目标预测系统的有效性,文中采用了文本挖掘的方式,与传统预测系统进行实验对比,验证其有效性。

根据传统预测系统和文中预测系统的实际预测效果,记录两种系统预测结果的准确率,图7 为传统预测系统和文中设计的预测系统在对网络信息搜索目标进行预测时,得到的目标信息与真实目标信息的准确率对比结果。

图7 准确率实验结果

由图7 可知,两个预测系统同时对网络信息搜索目标进行分类预测,但得到的预测结果大不相同,传统预测系统对目标信息预测的准确率为70%,而文中设计的预测系统对目标信息预测的准确率为88%,比传统系统高了18%,说明文中设计的预测系统对目标信息的预测准确率更高。

预测时间实验结果如表1 所示。

表1 预测时间实验结果

根据表1 可知,文中提出的文本挖掘网络信息预测系统预测耗时远远小于传统系统,预测能力更好。

传统的预测系统预测不协调信息数据的能力较低,能力值仅为0.1,与标准能力值1.5 相差很多,而文中设计的预测系统预测不协调信息数据的能力强,能力值达到1.8,比标准能力值高0.3,虽然传统的预测系统和文中设计的预测系统都能预测网络信息搜索目标,但是传统预测系统预测效果差,预测结果的准确率远远低于文中设计的预测系统,且预测性能较差,所以文中设计的基于文本挖掘的网络信息搜索目标预测系统优于传统预测系统,预测效果更佳,有效性和可行性更高。

4 结束语

文中设计了基于文本挖掘的网络信息搜索目标预测系统,该预测系统采用了文本挖掘技术,利用其较好的网络数据提取能力,从海量的网络信息数据中提取出目标数据,节省了提取时间。在预测系统硬件方面,文中设计了采集器、处理器、存储器、传输器,为预测系统提供了有力的硬件支撑,在预测系统软件方面,阐述了文本挖掘的工作原理以及软件流程,最后通过实验验证了文中设计的基于文本挖掘的网络信息搜索目标预测系统的有效性,预测效果更优于传统系统,具有较高的有效性和可行性。

猜你喜欢

采集器处理器芯片
芯片会议
Dirac Live加持!让好效果来得更容易 ROTEL Rotel RAP-1580MKⅡ AV功放/RSP-1576MKⅡ环绕声处理器/RMB-1585五声道功放
COVID-19大便标本采集器的设计及应用
关于射频前端芯片研发与管理模式的思考
多稳态压电振动能量采集器的动力学模型及其特性分析
装错芯片的机器人
新型自动气象站采集器故障判断分析
火线热讯
AItera推出Nios II系列软核处理器