C#读取Excel几种方法的体会

(1) OleDb: 用这种方法读取Excel速度还是非常的快的,但这种方式读取数据的时候不太灵活,不过可以在 DataTable 中对数据进行一些删减修改

为江川等地区用户提供了全套网页设计制作服务,及江川网站建设行业解决方案。主营业务为成都做网站、网站设计、江川网站设计,以传统方式定制建设网站,并提供域名空间备案等一条龙服务,秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求,就会得到认可,从而选择与我们长期合作。这样,我们也可以走得更远!

这种方式将Excel作为一个数据源,直接用Sql语句获取数据了。所以读取之前要知道此次要读取的Sheet(当然也可以用序号,类似dt.Row[0][0]。这样倒是不需要知道Sheet)
?

 
 
 
  1. if (fileType == ".xls")  
  2.    connStr = "Provider=Microsoft.Jet.OLEDB.4.0;" + "Data Source=" + fileName + ";" + ";Extended Properties=\"Excel 8.0;HDR=YES;IMEX=1\"";  
  3. else 
  4.    connStr = "Provider=Microsoft.ACE.OLEDB.12.0;" + "Data Source=" + fileName + ";" + ";Extended Properties=\"Excel 12.0;HDR=YES;IMEX=1\"";  
  5.    
  6. OleDbConnection conn new OleDbConnection(connStr);  
  7. DataTable dtSheetName = conn.GetOleDbSchemaTable(OleDbSchemaGuid.Tables, new object[] { null, null, null, "TABLE" }); 

以上是读取Excel的Sheet名,xls和xlsx的连接字符串也不一样的,可以根据文件的后缀来区别。这里需要注意的一点,Excel里面只有一个Sheet,但通过这种方式读取Sheet可能会大于一个。原因已经有人在别的网站说过了,偷一下懒O(∩_∩)O,下面文段来自【cdwolfling】

【在使用过程中发现取出的Sheet和实际excel不一致, 会多出不少。目前总结后有两种情况:

1. 取出的名称中,包括了XL命名管理器中的名称(参见XL2007的公式--命名管理器, 快捷键Crtl+F3);

2. 取出的名称中,包括了FilterDatabase后缀的, 这是XL用来记录Filter范围的,  参见http://www.mrexcel.com/forum/showthread.php?t=27225;

对于***点比较简单, 删除已有命名管理器中的内容即可;第二点处理起来比较麻烦, Filter删除后这些名称依然保留着,简单的做法是新增sheet然后将原sheet Copy进去】

---------------------------------

但实际情况并不能为每个Excel做以上检查【cdwolfling】也给出了过滤的方案,当时还是有点问题,本来补充了一点。总之先看代码吧

 
 
 
  1. for (int i = 0; i < dtSheetName.Rows.Count; i++)  
  2.  
  3. {  
  4. ?  
  5. SheetName = (string)dtSheetName.Rows[i]["TABLE_NAME"];  
  6.    
  7. if (SheetName .Contains("$") && !SheetName .Replace("'", "").EndsWith("$"))continue;//过滤无效SheetName完毕....  
  8.  
  9. da.SelectCommand = new OleDbCommand(String.Format(sql_F, tblName), conn);  
  10. DataSet dsItem = new DataSet();  
  11. da.Fill(dsItem, tblName);  
  12. ?  

因为读取出来无效SheetName一般情况***一个字符都不会是$。如果SheetName有一些特殊符号,读取出来的SheetName会自动加上单引号,比如在Excel中将SheetName编辑成:MySheet(1),此时读取出来的SheetName就为:'MySheet(1)$',所以判断***一个字符是不是$之前***过滤一下单引号。

优点:读取方式简单、读取速度快

缺点:除了读取过程不太灵活之外,这种读取方式还有个弊端就是,当Excel数据量很大时。会非常占用内存,当内存不够时会抛出内存溢出的异常。

不过一般情况下还是非常不错的

读取Excel完整代码:

 
 
 
  1. ///   
  2.         /// 读取Excel文件到DataSet中  
  3.         ///   
  4.         /// 文件路径  
  5.         ///   
  6.         public static DataSet ToDataTable(string filePath)  
  7.         {  
  8.             string connStr = "";             
  9.             string fileType = System.IO.Path.GetExtension(fileName);  
  10.             if (string.IsNullOrEmpty(fileType)) return null;  
  11.    
  12.             if (fileType == ".xls")  
  13.                 connStr = "Provider=Microsoft.Jet.OLEDB.4.0;" + "Data Source=" + filePath+ ";" + ";Extended Properties=\"Excel 8.0;HDR=YES;IMEX=1\"";  
  14.             else 
  15.                 connStr = "Provider=Microsoft.ACE.OLEDB.12.0;" + "Data Source=" + filePath+ ";" + ";Extended Properties=\"Excel 12.0;HDR=YES;IMEX=1\"";  
  16.             string sql_F = "Select * FROM [{0}]";  
  17.    
  18.             OleDbConnection conn = null;  
  19.             OleDbDataAdapter da = null;  
  20.             DataTable dtSheetName= null;  
  21.    
  22.             DataSet ds = new DataSet();  
  23.             try 
  24.             {  
  25.                 // 初始化连接,并打开  
  26.                 conn = new OleDbConnection(connStr);  
  27.                 conn.Open();  
  28.    
  29.                 // 获取数据源的表定义元数据                         
  30.                 string SheetName = "";  
  31.                 dtSheetName= conn.GetOleDbSchemaTable(OleDbSchemaGuid.Tables, new object[] { null, null, null, "TABLE" });  
  32.    
  33.                 // 初始化适配器  
  34.                 da = new OleDbDataAdapter();  
  35.                 for (int i = 0; i < dtSheetName.Rows.Count; i++)  
  36.                 {  
  37.                     SheetName = (string)dtSheetName.Rows[i]["TABLE_NAME"];  
  38.    
  39.                     if (SheetName .Contains("$") && !SheetName .Replace("'", "").EndsWith("$"))  
  40.                     {  
  41.                         continue;  
  42.                     }  
  43.    
  44.                     da.SelectCommand = new OleDbCommand(String.Format(sql_F, SheetName ), conn);  
  45.                     DataSet dsItem = new DataSet();  
  46.                     da.Fill(dsItem, tblName);  
  47.    
  48.                     ds.Tables.Add(dsItem.Tables[0].Copy());  
  49.                 }  
  50.             }  
  51.             catch (Exception ex)  
  52.             {  
  53.             }  
  54.             finally 
  55.             {  
  56.                 // 关闭连接  
  57.                 if (conn.State == ConnectionState.Open)  
  58.                 {  
  59.                     conn.Close();  
  60.                     da.Dispose();  
  61.                     conn.Dispose();  
  62.                 }  
  63.             }  
  64.             return ds;  
  65.         } 

#p#

(2):Com组件的方式读取Excel

这种方式需要先引用 Microsoft.Office.Interop.Excel 。***说下这种方式的优缺点

优点:可以非常灵活的读取Excel中的数据

缺点:如果是Web站点部署在IIS上时,还需要服务器机子已安装了Excel,有时候还需要为配置IIS权限。最重要的一点因为是基于单元格方式读取的,所以数据很慢(曾做过试验,直接读取千行、200多列的文件,直接读取耗时15分钟。即使采用多线程分段读取来提高CPU的利用率也需要8分钟。PS:CPU I3)

需要读取大文件的的童鞋们慎重。

附上单线程和多线程读取类:

 
 
 
  1. public class ExcelOptions  
  2.     {  
  3.         private Stopwatch wath = new Stopwatch();  
  4.    
  5.         ///   
  6.         /// 使用COM读取Excel  
  7.         ///   
  8.         /// 路径  
  9.         /// DataTabel  
  10.         public System.Data.DataTable GetExcelData(string excelFilePath)  
  11.         {  
  12.             Excel.Application app = new Excel.Application();  
  13.             Excel.Sheets sheets;  
  14.             Excel.Workbook workbook = null;  
  15.             object oMissiong = System.Reflection.Missing.Value;  
  16.             System.Data.DataTable dt = new System.Data.DataTable();  
  17.    
  18.             wath.Start();  
  19.    
  20.             try 
  21.             {  
  22.                 if (app == null)  
  23.                 {  
  24.                     return null;  
  25.                 }  
  26.    
  27.                 workbook = app.Workbooks.Open(excelFilePath, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong);  
  28.    
  29.                 //将数据读入到DataTable中——Start    
  30.    
  31.                 sheets = workbook.Worksheets;  
  32.                 Excel.Worksheet worksheet = (Excel.Worksheet)sheets.get_Item(1);//读取***张表  
  33.                 if (worksheet == null)  
  34.                     return null;  
  35.    
  36.                 string cellContent;  
  37.                 int iRowCount = worksheet.UsedRange.Rows.Count;  
  38.                 int iColCount = worksheet.UsedRange.Columns.Count;  
  39.                 Excel.Range range;  
  40.    
  41.                 //负责列头Start  
  42.                 DataColumn dc;  
  43.                 int ColumnID = 1;  
  44.                 range = (Excel.Range)worksheet.Cells[1, 1];  
  45.                 while (range.Text.ToString().Trim() != "")  
  46.                 {  
  47.                     dc = new DataColumn();  
  48.                     dc.DataType = System.Type.GetType("System.String");  
  49.                     dc.ColumnName = range.Text.ToString().Trim();  
  50.                     dt.Columns.Add(dc);  
  51.    
  52.                     range = (Excel.Range)worksheet.Cells[1, ++ColumnID];  
  53.                 }  
  54.                 //End  
  55.    
  56.                 for (int iRow = 2; iRow <= iRowCount; iRow++)  
  57.                 {  
  58.                     DataRow dr = dt.NewRow();  
  59.    
  60.                     for (int iCol = 1; iCol <= iColCount; iCol++)  
  61.                     {  
  62.                         range = (Excel.Range)worksheet.Cells[iRow, iCol];  
  63.    
  64.                         cellContent = (range.Value2 == null) ? "" : range.Text.ToString();  
  65.    
  66.                         //if (iRow == 1)  
  67.                         //{  
  68.                         //    dt.Columns.Add(cellContent);  
  69.                         //}  
  70.                         //else  
  71.                         //{  
  72.                             dr[iCol - 1] = cellContent;  
  73.                         //}  
  74.                     }  
  75.    
  76.                     //if (iRow != 1)  
  77.                     dt.Rows.Add(dr);  
  78.                 }  
  79.    
  80.                 wath.Stop();  
  81.                 TimeSpan ts = wath.Elapsed;  
  82.    
  83.                 //将数据读入到DataTable中——End  
  84.                 return dt;  
  85.             }  
  86.             catch 
  87.             {  
  88.                    
  89.                 return null;  
  90.             }  
  91.             finally 
  92.             {  
  93.                 workbook.Close(false, oMissiong, oMissiong);  
  94.                 System.Runtime.InteropServices.Marshal.ReleaseComObject(workbook);  
  95.                 workbook = null;  
  96.                 app.Workbooks.Close();  
  97.                 app.Quit();  
  98.                 System.Runtime.InteropServices.Marshal.ReleaseComObject(app);  
  99.                 app = null;  
  100.                 GC.Collect();  
  101.                 GC.WaitForPendingFinalizers();  
  102.             }  
  103.         }  
  104.    
  105.    
  106.         ///   
  107.         /// 使用COM,多线程读取Excel(1 主线程、4 副线程)  
  108.         ///   
  109.         /// 路径  
  110.         /// DataTabel  
  111.         public System.Data.DataTable ThreadReadExcel(string excelFilePath)  
  112.         {  
  113.             Excel.Application app = new Excel.Application();  
  114.             Excel.Sheets sheets = null;  
  115.             Excel.Workbook workbook = null;  
  116.             object oMissiong = System.Reflection.Missing.Value;  
  117.             System.Data.DataTable dt = new System.Data.DataTable();  
  118.    
  119.             wath.Start();  
  120.    
  121.             try 
  122.             {  
  123.                 if (app == null)  
  124.                 {  
  125.                     return null;  
  126.                 }  
  127.    
  128.                 workbook = app.Workbooks.Open(excelFilePath, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong, oMissiong);  
  129.    
  130.                 //将数据读入到DataTable中——Start    
  131.                 sheets = workbook.Worksheets;  
  132.                 Excel.Worksheet worksheet = (Excel.Worksheet)sheets.get_Item(1);//读取***张表  
  133.                 if (worksheet == null)  
  134.                     return null;  
  135.    
  136.                 string cellContent;  
  137.                 int iRowCount = worksheet.UsedRange.Rows.Count;  
  138.                 int iColCount = worksheet.UsedRange.Columns.Count;  
  139.                 Excel.Range range;  
  140.    
  141.                 //负责列头Start  
  142.                 DataColumn dc;  
  143.                 int ColumnID = 1;  
  144.                 range = (Excel.Range)worksheet.Cells[1, 1];  
  145.                 //while (range.Text.ToString().Trim() != "")  
  146.                 while (iColCount >= ColumnID)  
  147.                 {  
  148.                     dc = new DataColumn();  
  149.                     dc.DataType = System.Type.GetType("System.String");  
  150.    
  151.                     string strNewColumnName = range.Text.ToString().Trim();  
  152.                     if (strNewColumnName.Length == 0) strNewColumnName = "_1";  
  153.                     //判断列名是否重复  
  154.                     for (int i = 1; i < ColumnID; i++)  
  155.                     {  
  156.                         if (dt.Columns[i - 1].ColumnName == strNewColumnName)  
  157.                             strNewColumnName = strNewColumnName + "_1";  
  158.                     }  
  159.    
  160.                     dc.ColumnName = strNewColumnName;  
  161.                     dt.Columns.Add(dc);  
  162.    
  163.                     range = (Excel.Range)worksheet.Cells[1, ++ColumnID];  
  164.                 }  
  165.                 //End  
  166.    
  167.                 //数据大于500条,使用多进程进行读取数据  
  168.                 if (iRowCount - 1 > 500)  
  169.                 {  
  170.                     //开始多线程读取数据  
  171.                     //新建线程  
  172.                     int b2 = (iRowCount - 1) / 10;  
  173.                     DataTable dt1 = new DataTable("dt1");  
  174.                     dt1 = dt.Clone();  
  175.                     SheetOptions sheet1thread = new SheetOptions(worksheet, iColCount, 2, b2 + 1, dt1);  
  176.                     Thread othread1 = new Thread(new ThreadStart(sheet1thread.SheetToDataTable));  
  177.                     othread1.Start();  
  178.    
  179.                     //阻塞 1 毫秒,保证***个读取 dt1  
  180.                     Thread.Sleep(1);  
  181.    
  182.                     DataTable dt2 = new DataTable("dt2");  
  183.                     dt2 = dt.Clone();  
  184.                     SheetOptions sheet2thread = new SheetOptions(worksheet, iColCount, b2 + 2, b2 * 2 + 1, dt2);  
  185.                     Thread othread2 = new Thread(new ThreadStart(sheet2thread.SheetToDataTable));  
  186.                     othread2.Start();  
  187.    
  188.                     DataTable dt3 = new DataTable("dt3");  
  189.                     dt3 = dt.Clone();  
  190.                     SheetOptions sheet3thread = new SheetOptions(worksheet, iColCount, b2 * 2 + 2, b2 * 3 + 1, dt3);  
  191.                     Thread othread3 = new Thread(new ThreadStart(sheet3thread.SheetToDataTable));  
  192.                     othread3.Start();  
  193.    
  194.                     DataTable dt4 = new DataTable("dt4");  
  195.                     dt4 = dt.Clone();  
  196.                     SheetOptions sheet4thread = new SheetOptions(worksheet, iColCount, b2 * 3 + 2, b2 * 4 + 1, dt4);  
  197.                     Thread othread4 = new Thread(new ThreadStart(sheet4thread.SheetToDataTable));  
  198.                     othread4.Start();  
  199.    
  200.                     //主线程读取剩余数据  
  201.                     for (int iRow = b2 * 4 + 2; iRow <= iRowCount; iRow++)  
  202.                     {  
  203.                         DataRow dr = dt.NewRow();  
  204.                         for (int iCol = 1; iCol <= iColCount; iCol++)  
  205.                         {  
  206.                             range = (Excel.Range)worksheet.Cells[iRow, iCol];  
  207.                             cellContent = (range.Value2 == null) ? "" : range.Text.ToString();  
  208.                             dr[iCol - 1] = cellContent;  
  209.                         }  
  210.                         dt.Rows.Add(dr);  
  211.                     }  
  212.    
  213.                     othread1.Join();  
  214.                     othread2.Join();  
  215.                     othread3.Join();  
  216.                     othread4.Join();  
  217.    
  218.                     //将多个线程读取出来的数据追加至 dt1 后面  
  219.                     foreach (DataRow dr in dt.Rows)  
  220.                         dt1.Rows.Add(dr.ItemArray);  
  221.                     dt.Clear();  
  222.                     dt.Dispose();  
  223.    
  224.                     foreach (DataRow dr in dt2.Rows)  
  225.                         dt1.Rows.Add(dr.ItemArray);  
  226.                     dt2.Clear();  
  227.                     dt2.Dispose();  
  228.    
  229.                     foreach (DataRow dr in dt3.Rows)  
  230.                         dt1.Rows.Add(dr.ItemArray);  
  231.                     dt3.Clear();  
  232.                     dt3.Dispose();  
  233.    
  234.                     foreach (DataRow dr in dt4.Rows)  
  235.                         dt1.Rows.Add(dr.ItemArray);  
  236.                     dt4.Clear();  
  237.                     dt4.Dispose();  
  238.    
  239.                     return dt1;  
  240.                 }  
  241.                 else 
  242.                 {  
  243.                     for (int iRow = 2; iRow <= iRowCount; iRow++)  
  244.                     {  
  245.                         DataRow dr = dt.NewRow();  
  246.                         for (int iCol = 1; iCol <= iColCount; iCol++)  
  247.                         {  
  248.                             range = (Excel.Range)worksheet.Cells[iRow, iCol];  
  249.                             cellContent = (range.Value2 == null) ? "" : range.Text.ToString();  
  250.                             dr[iCol - 1] = cellContent;  
  251.                         }  
  252.                         dt.Rows.Add(dr);  
  253.                     }  
  254.                 }  
  255.    
  256.                 wath.Stop();  
  257.                 TimeSpan ts = wath.Elapsed;  
  258.                 //将数据读入到DataTable中——End  
  259.                 return dt;  
  260.             }  
  261.             catch 
  262.             {  
  263.    
  264.                 return null;  
  265.             }  
  266.             finally 
  267.             {  
  268.                 workbook.Close(false, oMissiong, oMissiong);  
  269.                 System.Runtime.InteropServices.Marshal.ReleaseComObject(workbook);  
  270.                 System.Runtime.InteropServices.Marshal.ReleaseComObject(sheets);  
  271.                 workbook = null;  
  272.                 app.Workbooks.Close();  
  273.                 app.Quit();  
  274.                 System.Runtime.InteropServices.Marshal.ReleaseComObject(app);  
  275.                 app = null;  
  276.       

    分享文章:C#读取Excel几种方法的体会
    链接分享:http://www.mswzjz.cn/qtweb/news37/203837.html

    攀枝花网站建设、攀枝花网站运维推广公司-贝锐智能,是专注品牌与效果的网络营销公司;服务项目有等

    广告

    声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 贝锐智能