Android Java实现余弦匹配算法示例代码

 Java实现余弦匹配算法

最近在做一个通讯交友的项目,项目中有一个这样的需求,通过用户的兴趣爱好,为用户寻找推荐兴趣相近的好友。其实思路好简单,把用户的兴趣爱好和其他用户的兴趣爱好进行一个匹配,当他们的爱好相似度比较高的时候就给双方进行推荐。那么如何进行比较是一个问题,其实我们可以通过余弦匹配算法来对用户的兴趣爱好进行比较,根据计算出来的值来得到一个兴趣爱好相近好友列表,并进行排序。

因为我做的项目是Android端的,所以算法是通过Java实现的,废话不过多说了,下面是算法的实现:

package com; 
 
import java.util.HashMap; 
import java.util.Iterator; 
import java.util.Map; 
 
/** 
 * 余弦匹配算法 
 * 
 */ 
public class SimilarDegreeByCos { 
   
   /** 
   * 计算两个字符串的相似度,简单的余弦计算,未添权重  
   * @param str1 
   * @param str2 
   * @return 返回计算的相识度 
   */ 
   public static double getSimilarDegree(String str1, String str2)  
   {  
    //创建向量空间模型,使用map实现,主键为词项,值为长度为2的数组,存放着对应词项在字符串中的出现次数  
     Map<String, int[]> vectorSpace = new HashMap<String, int[]>();  
     int[] itemCountArray = null;//为了避免频繁产生局部变量,所以将itemCountArray声明在此  
       
     //以空格为分隔符,分解字符串  
     String strArray[] = str1.split(" ");  
     for(int i=0; i<strArray.length; ++i)  
     {  
       if(vectorSpace.containsKey(strArray[i]))  
         ++(vectorSpace.get(strArray[i])[0]);  
       else  
       {  
         itemCountArray = new int[2];  
         itemCountArray[0] = 1;  
         itemCountArray[1] = 0;  
         vectorSpace.put(strArray[i], itemCountArray);  
       }  
     }  
       
     strArray = str2.split(" ");  
     for(int i=0; i<strArray.length; ++i)  
     {  
       if(vectorSpace.containsKey(strArray[i]))  
         ++(vectorSpace.get(strArray[i])[1]);  
       else  
       {  
         itemCountArray = new int[2];  
         itemCountArray[0] = 0;  
         itemCountArray[1] = 1;  
         vectorSpace.put(strArray[i], itemCountArray);  
       }  
     }  
     //计算相似度  
     double vector1Modulo = 0.00;//向量1的模  
     double vector2Modulo = 0.00;//向量2的模  
     double vectorProduct = 0.00; //向量积  
     Iterator iter = vectorSpace.entrySet().iterator();  
     while(iter.hasNext())  
     {  
       Map.Entry entry = (Map.Entry)iter.next();  
       itemCountArray = (int[])entry.getValue();  
         
       vector1Modulo += itemCountArray[0]*itemCountArray[0];  
       vector2Modulo += itemCountArray[1]*itemCountArray[1];  
         
       vectorProduct += itemCountArray[0]*itemCountArray[1];  
     }  
     vector1Modulo = Math.sqrt(vector1Modulo);  
     vector2Modulo = Math.sqrt(vector2Modulo);  
      
     //返回相似度  
    return (vectorProduct/(vector1Modulo*vector2Modulo));  
   }  
     
   /** 
   * 主方法 
   */  
   public static void main(String args[])  
   {  
     String str1 = "阳光活泼 跑步 羽毛球";  
     String str2 = "爱美食 跑步 篮球 足球 冰棒球 骑马 游泳";  
     String str3 = "90后 动漫 旅游 爱美女";  
     String str4 = "阳光活泼 爱游戏 爱代码 码农";  
     String str5 = "羽毛球 羽毛球 羽毛球 羽毛球";  
     String str6 = "阳光活泼 跑步 羽毛球";  
       
     System.out.println("str1和str2相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str2));  
     System.out.println("str1和str3相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str3));  
     System.out.println("str1和str4相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str4));  
     System.out.println("str1和str5相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str5));  
     System.out.println("str1和str6相识度:" + SimilarDegreeByCos.getSimilarDegree(str1, str6));  
   }  
 
} 

效果:

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!