当前位置: 首页 > >

基于网格和密度的数据流聚类算法_论文

发布时间:

第2 7卷第 3期  2 1 年 3 月  01 商 丘 师 范 学 院 学 报  J U N L O   H N Q U T A HE SC L E E O R A   FS A G I  E C R   O L G   Vo . 7 1 2  No 3 .  Ma c r h, 2 1 01   基 于 网格 和 密 度 的 数 据 流 聚 类 算 法  张丽 , 胡颖  ( 丘 师 范 学 院 计 算机 科 学 系 , 商 河南 商 丘 46 0 ) 7 00  摘 要 : 对数 据 流 的特 点 , 出 了一 种 新 的 网格 密度 结合 的 G T 针 提 C S算 法. 它采 用 了双 层 架 构 , 线 层 实现 了 网 在   格密度参数的 自设定 , 离线层 以网格单元 的重心为 中心点 , 建立一个最大的子 网格 , 使候 选网格 中的局部 密集区域  转化 成 了 密集 网格 . 后 使 用 最 小 生 成树 的算 法生 成 进 行 聚 类 结 果 . 高 了聚 类 效 果. 最 提   关 键 词 : 据 流 ; 类 ; 网格   数 聚 子 中图 分 类号 : ̄ 7  T 4 文 献 标 识 码 :  A 文章 编 号 :6 2— 6 0 2 1 )3— 0 0— 4 17 3 0 (0 10 07 0  Gr d a   e st   n  a a s r a   l t rng a g r t m   i   nd d n iy o d t   t e m cuse i   l o ih Z ANG  i HU  n   H L, Yi g ( e to C m u r c n e S a g i T ah r C l g ,h nqu4 6 0 C i ) D p .f o p t   i c ,h n qu ec e   o ee S a g i 7 0 0, hn     eS e   s l   a A b t a t Ac o d n  o t e c a a trsiso  h   aa sr a , i  p r p e e td a n w  l se n   lo t m  s r c : c r i g t h   h r ce it   ft e d t  te m h spa e   r s n e     e c u tr g a g r h GTCS c i i   whc   o i e  h   p r a h b s d o   e st  n   r .B   a so   e mo e o   o b e—l y rc n t cin,t e ih c mb n d te a p o c   a e   n d n i a d g d y i y me n   ft   d l f u l h   d a e  o s u t r o h  o l e l y rs tte k y o  e ste  ft e d t  rd   u o t a l n i  a e   e h   e   fd n iis o h   a a g i s a t mai l n c y,t e ofi   a e   sn  h   aa g a i   o h   h   f ne ly r u i g t e d t   r v t frt e l y c n e ,b i     xmu o  u g i e tr u l a ma i m  fs b rd,ma i g t e d n e r go so  h   a d d t  rd  n o d n e g i .I  h   n   d k n  h   e s  e in   ft e c n i ae g i s it  e s   rd n t e e d, i u e t e mi i t s  h   n mum  pa n n  r e c lt rn   g rt m o g tt e cuse n   e u t ,i r v d t e cu trn   fe t   s n i g te   h se i g Alo h t  e h   l tr g r s ls mp o e  h   l se g afc . i i i   Ke   r y wo ds: a a sr a ; l se n d t  te m cu tr g;s b rd i u g i  0 引  言    随着科 学技术 的 日益发展 , 特别是 计算 机和传感 器技 术 的应 用 , 电话通 信业务 , 在 股票 交易数 据 , 侵检  入 测数 据 , 网络监控 , b页 面访 问 , We 卫星遥 感 等业 务 中产 生 了海 量 的数 据 . 种 按 照 时 间顺 序连 续 到达 的数  这 据对象 集合 我们称 为数 据流  . 如何 有效 的分析 这些数 据 , 发现 其 中隐 藏 的知识 显得 尤 为重要 . 与传 统 的数  据相 比 , 数据 流具有数 据量 大 、 随着 时 间动态变化 、 有序 到达 、 长度未 知 、 询历史 数据 困难等 特点 . 查 因此对 于  数据流的挖掘要在有限的内存 中完成对数据的及时处理. 通过单次扫描机制 , 在内存中保存数据流的概要信  息 ,以支持后 续 的计 算 , 成挖掘 结果 的*似性 . 形 数据 流是一 个连续 、 在线 的过程 , 传统 的聚类 算法 无法 在数  据 流 中直接 应用 , 因此数 据流 的聚类对 数 据挖 掘 领域 提 出了前 所 未 有 的新 挑 战 , 也成 为许 多学 者 研究 的热  点.   聚类 分析作 为数据 流的研究 热点 , 它在数 据挖 掘 、 模式识 别 、 图像处 理 、 统计 数 据分析 、 机器分 析 、 生物学  等工程 和技术 领域 有着广



友情链接: