KlustaKwik的速度非常快,并且支持大数据量的分类(48维100000点的数据),比一般的自动分类系统自少快10倍。
所基于对算法是CEM,比标准的EM算法要快得多。
它还支持自动分裂和检查特征词,这样保证更加有效的收敛。
程序是纯C++写的,你可以在Linux或Unix下直接使用GCC编译。
KlustaKwik is a program for unsupervised classification of multidimensional
continuous data. It arose from a specific need - automatic sorting of neuronal
action potential waveforms (see KD Harris et al, Journal of Neurophysiology
84:401-414,2000), but works for any type of data.