基于Tomek 链的边界少数类样本合成过采样方法.

陶佳晴, 贺作伟, 冷强奎, 翟军昌… - Application Research of …, 2023 - search.ebscohost.com
在类别不平衡数据集中, 由于靠近类边界的样本更容易被错分, 因此准确识别边界样本对分类
具有重要意义. 现有方法通常采用K 近邻来标识边界样本, 准确率有待提高. 针对上述问题 …

基于迁移成分分析的库岸跨区域滑坡易发性评价

苏燕, 黄绍翔, 赖晓鹤, 陈耀鑫, 杨凌鋆, 林川, 谢秀栋… - 地球科学, 2024 - earth-science.net
考虑到滑坡编录制作的耗时性, 建立一种“可迁移” 的滑坡易发性模型已越发重要.
合理利用现有完整滑坡数据地区的样本集对无样本区域进行易发性预测具有重要意义 …

一种面向不平衡分类的改进多决策树算法

段化娟, 尉永清, 刘培玉, 周鹏 - 《 广西师范大学学报》(自然科学 …, 2020 - gxsf.magtech.com.cn
在处理不平衡数据集时, 为了降低类重叠对分类效果的影响, 避免过采样造成的过拟合现象,
以及欠采样造成的信息丢失问题, 本文提出一种基于欠采样与属性选择的多决策树方法UAMDT …

[PDF][PDF] 基于深度学习的不均衡网络数据分类技术研究

李青, 赵唱, 鞠永慧, 何鑫泰, 张健 - 信息工程大学学报, 2021 - xxgcxb.cnjournals.com
在现实网络环境中, 数据分布不均衡是普遍现象, 也是研究的热点问题. 利用传统机器学习算法
解决该问题的研究成果较多, 综述性研究也较丰富. 但当前从深度学习的角度探讨数据不均衡 …

[PDF][PDF] 基于混合采样策略的改进随机森林不平衡数据分类算法

郑建华, 刘双印, 贺超波… - 重庆理工大学学报(自然科学 …, 2019 - clgzk.qks.cqut.edu.cn
针对传统分类算法难以处理不平衡数据的问题, 提出了一种基于混合采样策略的改进随机森林不
平衡数据分类算法. 首先从理论上分析了混合采样策略提升随机森林基分类器多样性的机理 …

科研社交网络中基于异质网络分析的列表级排序学习推荐方法研究

岳峰, 王含茹, 张馨悦, 王刚 - 计算机应用研究, 2020 - arocmag.com
摘要In view of the fact that the existing recommendation methods for academic papers
cannot make full use of the hete-rogeneous relations between entities in scientific social …

整合DBSCAN 和改进SMOTE 的过采样算法.

王亮, 冶继民 - Journal of Computer Engineering & …, 2020 - search.ebscohost.com
针对SMOTE (Synthetic Minority Over-sampling Technique) 等传统过采样算法存在的忽略类内
不平衡, 扩展少数类的分类区域以及合成的新样本高度相似等问题, 基于综合考虑类内不平衡和 …

改进的不平衡贝叶斯学习分类模型研究.

韩忠明, 刘聃, 段大高, 杨伟杰… - Application Research of …, 2020 - search.ebscohost.com
基于函数逼近的方法存在少数类样本不足时分类效果不佳的问题, 针对此问题提出了不平衡贝叶
斯学习分类模型. 模型引入类间隔似然函数, 用于降低后验分布在参数空间上存在的偏态性 …

[HTML][HTML] 面向不平衡甲状腺眼病数据集的分类算法对比研究及应用

张天凤, 赵廉, 邓浩然, 朱沁汶, 陈钱, 宋诗淳… - Software Engineering …, 2023 - hanspub.org
对不同数据进行分类是机器学习的研究热点, 然而在各大领域, 数据不平衡现象是普遍存在的.
现有的许多机器学习算法虽然取得了良好的效果, 但他们都是在默认数据集分布均衡的前提下 …

基于孤立森林采样策略的企业异常用水模式检测

林青轩, 郭强, 邓春燕, 王雅静, 刘建国 - 复杂系统与复杂性科学, 2020 - fzkx.qdu.edu.cn
摘要为解决企业异常用水模式检测过程中的低频短时间序列数据和不平衡分类问题,
提出了一种基于孤立森林采样策略的二分类预测方法. 首先构造用水波动性特征和统计性特征 …