Quartz.net打造信息抽取器

由于最近的一个项目需要定时抽取特定XML信息,然后保存到数据库,最后通过WebApi把手机端要使用的方法给暴露出来,所以去研究了一下Quartz.net。由于项目很小,我没用到Autofac,Repository模式,UOW这些东西,这个小项目中所涉及的知识点有:

1.Quartz.net配置

2.序列化XML信息到类对象中

3.AutoMapper做DomainModel和DTO之间的映射

4.WebApi允许多个Get方法的存在

下面我们一步一步的来进行说明。

让我们先来看看我们待处理的数据:http://price.agridoor.com.cn/nxt_price/uploads/2014/05/09/20140509_37.xml

image

从上图可以看到,这个xml数据有个根节点NXT_PRICE,并且根节点下面有很多个price子节点。那么如果我们想把这些xml数据反序列化到我们定义的类对象中,该怎么做呢?

其实很简单。

由于一个根节点NXT_PRICE下面有N个price子节点集合,所以我们创建如下的两个实体类来描述这种关系:

    [XmlRoot("NXT_PRICE")]
    public class NxtPriceModel
    {
        public NxtPriceModel()
        {
            priceItems = new List<PriceItemModel>();
        }

        [XmlElement("price")]
        public List<PriceItemModel> priceItems { get; set; }
    }

 

public class PriceItemModel
    {
        [XmlElement("seq")]
        public int Seq { get; set; }

        [XmlElement("name")]
        public string Name { get; set; }

        [XmlElement("type")]
        public string Type { get; set; }

        [XmlElement("price")]
        public decimal Price { get; set; }

        [XmlElement("unit")]
        public string Unit { get; set; }

        [XmlElement("time")]
        public string Time { get; set; }

        [XmlElement("first")]
        public string First { get; set; }

        [XmlElement("second")]
        public string Second { get; set; }

        [XmlElement("area")]
        public string Area { get; set; }
    }

这样两个实体类很简单,相信大家也看出了其中的包含关系。

然后如何反序列化到我们给定的实体类中呢? 这里使用XmlSerializer则是再合适不过的事情了。通过XmlSerializer对象,我们可以直接将对应的xml节点解释成实体类属性,并自动将数据保存到类中的集合对象中。

  WriteLog("=============================开始反序列化文件========================");
                    XmlSerializer ser = new XmlSerializer(typeof(NxtPriceModel));
                    ms.Position = 0;
                    var result = (NxtPriceModel)ser.Deserialize(ms);

通过上面的代码,我们就能成功的将路径中的xml信息下载并保存到类集合中,非常方便。这样,我们就完成了xml序列化成类对象的功能。

 

数据都已经保存到类对象中了,下一步就让我们来Consume它。

我们创建一个Asp.net MVC4项目,并利用Install-package quartz命令将其添加到项目中。然后在项目中添加一个MyJob类,继承自IJob对象:

 public class MyJob : IJob
    {
        private object obj = new object();

        public void Execute(IJobExecutionContext context)
        {
            if (ShouldRun())
                Run();
        }

        private bool ShouldRun()
        {
            CommandPengEntities cpEntities = new CommandPengEntities();
            try
            {
                string strStart = DateTime.Now.ToString("yyyy-MM-dd") + " 00:00:00";
                string strEnd = DateTime.Now.ToString("yyyy-MM-dd") + " 23:59:59";

                DateTime? dtStart = DateTime.Parse(strStart);
                DateTime? dtEnd = DateTime.Parse(strEnd);

                var result = (from p in cpEntities.NxtPrice where p.Time >= dtStart && p.Time <= dtEnd select p).FirstOrDefault();
                if (result == null)
                {
                    WriteLog("当天数据不存在,准许插入新数据");
                    return true;  //当天数据未被插入
                }
                WriteLog("当天数据存在,禁止插入新数据");
                return false;   //当天数据已经插入
            }
            catch (Exception ex)
            {
                WriteLog(ex.InnerException.Message);
                return false;
            }
            finally
            {
                DisposeContext(cpEntities);
            }
        }

        private void Run()
        {
            string uri = "http://price.agridoor.com.cn/nxt_price/uploads/2014/05/09/20140509_37.xml";
            WriteLog("=============================开始进行文件获取========================");
            var request = HttpWebRequest.Create(uri);
            IAsyncResult iasync = request.BeginGetResponse((iar) =>
            {
                var requestCallBack = (HttpWebRequest)iar.AsyncState;
                var response = requestCallBack.EndGetResponse(iar);
                WriteLog("=============================获取文件内容结束========================");

                var stream = response.GetResponseStream();


                byte[] buffer = null;

                //将stream保存到MemoryStream中
                WriteLog("=============================保存内容到内存流========================");
                using (MemoryStream ms = new MemoryStream())
                {
                    int count = 0;
                    do
                    {
                        byte[] buf = new byte[1024];
                        count = stream.Read(buf, 0, 1024);
                        ms.Write(buf, 0, count);
                    }
                    while (stream.CanRead && count > 0);
                    buffer = ms.ToArray();

                    //string txt = Encoding.UTF8.GetString(buffer);

                    //开始反序列化
                    WriteLog("=============================开始反序列化文件========================");
                    XmlSerializer ser = new XmlSerializer(typeof(NxtPriceModel));
                    ms.Position = 0;
                    var result = (NxtPriceModel)ser.Deserialize(ms);

                    //检测是否为空
                    WriteLog("=============================检测文件是否为空========================");
                    if (result == null) return;
                    if (result.priceItems == null) return;
                    if (result.priceItems.Count == 0) return;

                    var allItems = result.priceItems;
                    var totalRecords = result.priceItems.Count;
                    int batch = 200;  //每200条批量提交一次
                    int totalExecuteCount = (totalRecords % batch == 0) ? (totalRecords / batch) : (totalRecords / batch + 1);

                    //写入数据库
                    lock (obj)
                    {
                        PerformLogicInsert(totalRecords, totalExecuteCount, batch, allItems);
                    }
                }
            }, request);
        }

        private void AddEntity(PriceItemModel pModel,CommandPengEntities cpEntities)
        {
            var itemShouldInsert = AutoMapper.Mapper.Map<NxtPrice>(pModel);
            cpEntities.NxtPrice.AddObject(itemShouldInsert);
        }

        private bool CommitEntity(CommandPengEntities cpEntities)
        {
            int rowAffected = cpEntities.SaveChanges();
            if (rowAffected > 0)
                return true;
            return false;
        }

        private void DisposeContext(CommandPengEntities cpEntities)
        {
            if (cpEntities != null)
                cpEntities.Dispose();
        }

        private void PerformLogicInsert(int totalRecords
                                       , int totalExecuteCount
                                      , int batch
                                      , List<PriceItemModel> allItems)
        {
            WriteLog("=============================启用事务控制========================");

            CommandPengEntities cpEntities = null;
            try
            {
                using (TransactionScope scope = new TransactionScope(TransactionScopeOption.Required, new TimeSpan(0, 3, 0)))
                {
                    cpEntities = new CommandPengEntities();

                    for (int i = 0; i < totalExecuteCount; i++)
                    {
                        int remainRecords = totalRecords - i * batch;
                        int isLastBatch = remainRecords / batch;
                        int loopCounter = 0;
                        if (isLastBatch > 0) //不是最后一批数据
                            loopCounter = batch;
                        else              //最后一批数据
                            loopCounter = remainRecords;

                        for (int j = 0; j < loopCounter; j++)
                        {
                            var item = allItems[i * batch + j];
                            AddEntity(item, cpEntities);
                        }

                        try
                        {
                            bool flag = CommitEntity(cpEntities);
                            if (flag) WriteLog(string.Format("第{0}批数据插入完毕,共计{1}条", i, loopCounter));
                            else WriteLog(string.Format("第{0}批数据插入失败", i));
                        }
                        catch (Exception ex)
                        {
                            WriteLog(ex.Message);
                            WriteLog(ex.InnerException.Message);
                        }
                    }
                    scope.Complete();
                    WriteLog("=============================事务提交成功========================");
                }
            }
            finally
            {
                DisposeContext(cpEntities);
            }
        }

        private void WriteLog(string content)
        {
            string logFile = AppDomain.CurrentDomain.BaseDirectory + "\log" + DateTime.Now.ToString("yyyyMMdd") + ".txt";
            using (FileStream stream = new FileStream(logFile, FileMode.Append))
            {
                byte[] buffer = Encoding.UTF8.GetBytes(DateTime.Now.ToString("yyyy-MM-dd hh:mm:ss") + "  " + content + Environment.NewLine);
                stream.Write(buffer, 0, buffer.Length);
                stream.Flush();
            }
        } 
    }

上面的代码主要是抽取数据,然后将数据写入到数据库中的操作行为.其中需要说到一点的就是Automapper的使用.

由于数据访问层,我直接使用的NxtPrice.edmx,所以会自动生成一个NxtPrice模型出来,这样当我们提交数据的时候,需要将对象进行转换:

  private void AddEntity(PriceItemModel pModel,CommandPengEntities cpEntities)
        {
            var itemShouldInsert = AutoMapper.Mapper.Map<NxtPrice>(pModel);
            cpEntities.NxtPrice.AddObject(itemShouldInsert);
        }

由于数据库插入对象时NxtPrice,而我们的数据集合对象是NxtPriceModel,所以这里需要将NxtPriceModel中的字段逐一赋值给NxtPrice对象,由于automapper能够提供类似的行为,所以我们采用automapper自动来进行.automapper会对比两个model的异同,只要是字段相同的话,都会自动进行映射.这样就省去了很多的操作步骤.

AutoMapper进行映射前,我们需要在Global.asax中配置一下,方可使用:

 private void ModelMapper()
        {
            //Model and DTO conversion
            AutoMapper.Mapper.CreateMap<PriceItemModel, NxtPrice>();
            AutoMapper.Mapper.CreateMap<NxtPrice,PriceItemModel>();
            
        }

这样就达到我们的自动映射的要求了.

最后需要说明的是,我们的Job写完之后,需要定时运行,这个该如何做呢?

由于Quartz.net中,工作分为创建计划任务->创建工作内容->创建触发条件->启动 四个步骤,所以这里我们就按照这四个步骤来进行:

private void StartSchedular()
        {
            IScheduler scheduler = null;
            // start up scheduler
            // construct a factory 
            ISchedulerFactory factory = new StdSchedulerFactory();
            // get a scheduler 
            scheduler = factory.GetScheduler();
            // start the scheduler 
            scheduler.Start();

            // create job  
            IJobDetail job = JobBuilder.Create<MyJob>()
                        .WithIdentity("MyJob", "MyJobs")
                        .Build();

            // create trigger  
            ITrigger trigger = TriggerBuilder.Create()
                .WithIdentity("MyJobTrigger", "MyJobs")
                // start at 7:30 every day
                .StartAt(DateBuilder.DateOf(7,30,0))
                .WithSimpleSchedule(x => x.WithInterval(TimeSpan.FromMilliseconds(1)).WithRepeatCount(0))
                .Build();

            // Schedule the job using the job and trigger   
            scheduler.ScheduleJob(job, trigger);  
        }

注释说的很明白了, 其中scheduler对象就是创建的计划任务.

job对象则是我们刚刚新建的MyJob类及其要执行的内容.

trigger对象则是设置触发条件,这里我们设置为每天7:30开始,运行一次即可.

最后一句则是将工作内容和触发器连接起来,以便进行控制.

这样运行之后,我们运行程序,就能够看到系统正常运行了.

image

数据库的数据都填充以后,我们开始编写我们的webapi代码了.这里由于不是讲解的重点,我就不多说了,但是需要注意一点的是,webapi中可以通过设置路由来允许多个Get方法并存:

   config.Routes.MapHttpRoute(
                name: "ApiByName",
                routeTemplate: "api/{controller}/{action}/{name}",
                defaults: null,
                constraints: new { name = @"^[a-z]+$" }
            );

这样当我们访问多个get方法的时候,就可以通过如下的方式访问了:

http://192.168.0.119/api/PriceItems/GetProductType/?cityName=新乡市

http://192.168.0.119/api/PriceItems/GetProvince/

最后需要说明的是,由于WebApi默认返回JSON格式,所以如果你想接受XML格式的内容,服务端是不需要做任何设置的。你只需要在客户端加上Accept:application/xml即可请求到xml的数据,非常方便。

百度网盘

腾讯网盘

原文地址:https://www.cnblogs.com/scy251147/p/3780718.html