Java判断Excel某列是不是有重复值
Java判断Excel某列是否有重复值
最近由于项目的需要,要求判断给定的Excle中某一列值,看其是否有重复,如果有重复显示重复字段名字以及都是在那些行重复了。下面直接给出代码,让大家做下参考。如有问题我们一起讨论~
/** * 判定Excel中某列是否有重复数据 * @param file 读取数据的源Excel * @param ignoreRows 读取数据忽略的行数,比如行头不需要读入 忽略的行数为1 * @param column 需要判定的字段所在列的位置,比如需要判定的字段在第三列, column=2;注意,0是算第一列 * @return 读出的Excel中数据的内容 * @throws FileNotFoundException * @throws IOException */ public boolean judgeRepeatExcle(File file, int column,int ignoreRows){ boolean flag=false; if(column>=0&&file.exists()){ /*实现excle的兼容读取*/ Workbook wb = null; try { wb = new XSSFWorkbook(new FileInputStream(file)); } catch (Exception ex) { try { wb= new HSSFWorkbook(new POIFSFileSystem(new BufferedInputStream(new FileInputStream(file)))); } catch (Exception e) { // TODO Auto-generated catch block e.printStackTrace(); } } //兼容读取设置结束 Cell cell = null; System.out.println("本Excel总共有"+wb.getNumberOfSheets()+" 个Sheet 。"); for (int sheetIndex = 0; sheetIndex < wb.getNumberOfSheets(); sheetIndex++) {//循环所有的sheet,一个excle中可能有多个sheet HashMap<String,String> map=new HashMap<String,String>(); HashMap<String,String> tmap=new HashMap<String,String>(); Sheet sheet = wb.getSheetAt(sheetIndex); int firstRowNum = sheet.getFirstRowNum(); int lastRowNum = sheet.getLastRowNum(); firstRowNum=firstRowNum>ignoreRows?firstRowNum:ignoreRows; Row row = null; for (int i = firstRowNum; i <= lastRowNum; i++) { row = sheet.getRow(i); //取得第i行 cell = row.getCell(column); //取得i行的第column列 String value ="";//保存i行的第column列的值 if (cell != null) { switch (cell.getCellType()) { case HSSFCell.CELL_TYPE_STRING: value = cell.getStringCellValue(); break; case HSSFCell.CELL_TYPE_NUMERIC: if (HSSFDateUtil.isCellDateFormatted(cell)) { Date date = cell.getDateCellValue(); if (date != null) { value = new SimpleDateFormat("yyyy-MM-dd hh:mm:ss").format(date); } else { value = ""; } } else { value = new DecimalFormat("0").format(cell.getNumericCellValue()); } break; case HSSFCell.CELL_TYPE_FORMULA: // 导入时如果为公式生成的数据则无值 if (!cell.getStringCellValue().equals("")) { value = cell.getStringCellValue(); } else { value = cell.getNumericCellValue() + ""; } break; case HSSFCell.CELL_TYPE_BLANK: break; case HSSFCell.CELL_TYPE_ERROR: value = ""; break; case HSSFCell.CELL_TYPE_BOOLEAN: value = (cell.getBooleanCellValue() == true ? "Y": "N"); break; default: value = ""; } } /*在excel中,计数是从0开始的,为了使结果与Excel中显示的行数保持一致,让行数newNum=为(i+1) */ int newNum=i+1; if(map.containsKey(value)){//如果Map集合中包含指定的键名,则返回true;否则返回false。 String lineNum=map.get(value);//拿到先前保存的行号 //System.out.println("先前保存的行号value="+value+" lineNum="+lineNum); if(tmap.containsKey(value)){ String str=tmap.get(value);//拿到先前保存的所有行号记录 tmap.put(value, str+" ,"+newNum);//更新后,显示效果:——》行重复:在第 2 ,3 , 5 }else{ tmap.put(value, "重复:行数位于第 "+lineNum+" ,"+newNum);//最后显示效果:——》行重复:在第 2 ,3 } } map.put(value, newNum+"");//把i行的第column列的值与行号保存到map中 } Iterator<Entry<String, String>> it=tmap.entrySet().iterator(); System.out.println("本Excel总共有"+wb.getNumberOfSheets()+" 个Sheet,第 "+(sheetIndex+1)+" 个Sheet中:"); while(it.hasNext()){ Map.Entry<String, String> entry = (Map.Entry<String, String>) it.next(); System.out.println("字段:"+entry.getKey()+" "+entry.getValue()); } flag=true; } return flag; } return flag; } public static void main( String arg[]){ ExcelOperate eo=new ExcelOperate(); File file=new File("D:\\11.xls"); System.out.println("asfsaf " +eo.judgeRepeatExcle(file, 0, 1)); }