不打开Revit判断rvt文件版本的两种方法

一、问题引入

最近接手的项目需要不打开Revit的情况下读取RVT文件,并且要支持多版本的功能,拿到一个revit的.rvt文件,需要判断一下该文件是由哪个Revit版本创建的。然后根据这个判定执行不同的逻辑。最简单的应用就是,选择合适的revit版本打开revit文件。

二、探索

1、解析.rvt文件流。

思路:拿到.rvt的文件流,然后判断流中是否包含类似2018,2017的东西。

结论:这种方法是可以的。

探索过程:

1、在通过无数次的实验之后,确定了Unicode编码是revi文件的编码方式,开发过程中可以自行使用Visual Studio Code打开RVT项目,按不同的编码打开看下内容。

2、 将文件流读入字节数组,然后将字节数组通过Unicode编码方式转换成String,可以找到类似版本信息的明文。

参考代码:

判断文件版本号,返回形如:2018,2019的字符串

 1 private const string BasicFileInfo = "BasicFileInfo";
 2 private const string MatchVersion = @"(?<=Autodesk Revit )20d{2}";
 3 
 4 
 5 /// <summary>
 6 /// 获取revit文件版本号[采用流方式]
 7 /// </summary>
 8 /// <param name="filePath"></param>
 9 /// <returns></returns>
10 public static string GetVersion_(string filePath)
11 {
12 var version = string.Empty;
13 Encoding useEncoding = Encoding.Unicode;
14 using (FileStream file = new FileStream(filePath, FileMode.Open))
15 {
16 //匹配字符有20个,为了防止分割对匹配造成的影响,需要验证20次偏移结果
17 for (int i = 0; i < 20; i++)
18 {
19 byte[] buffer = new byte[2000];
20 file.Seek(i, SeekOrigin.Begin);
21 while (file.Read(buffer, 0, buffer.Length) != 0)
22 {
23 var head = useEncoding.GetString(buffer);
24 Regex regex = new Regex(MatchVersion);
25 var match = regex.Match(head);
26 if (match.Success)
27 {
28 version = match.ToString();
29 return version;
30 }
31 }
32 }
33 }
34 return version;
35 }

上面这种方法,简单轻便依赖少,这些都是优点,但是有一个我不能接收的缺点,就是可控性太差,结果是试出来的,而且在代码实现的时候也要用代码去尝试搜索,是凭运气找到的,这种事总让人感觉不踏实。有没有解决这类问题的常规思路呢?经过一天孜孜不倦探索,终于走了些眉目。

2、解压revit文件

这里说解压不太准确,但直观上给人的感觉确实是解压。就是因为这个错觉,让我在歧途上晃悠了一天。

这是一个源于梦的故事。这些日子一直在考虑.rvt文件流内部信息提取的事情,终于在某个晚上,我做了一个梦。梦见通过解压软件把.rvt文件给解压了,早上到公司按这个方法试了一下,果然出现了让人惊喜的一幕。 .rvt文件真的可以使用解压软件解压,而且不需要特定的解压软件,最普通的那种就行。这件事让我兴奋异常。

后来我又在一个名为BasicFileInfo的文件里找到了如下信息。

/ A u t o d e s k R e v i t 2 0 1 7 ( B u i l d : 2 0 1 6 0 2 2 5 _ 1 5 1 5 ( x 6 4 ) ) E :  R e v i t Km諎 y橆v1 . r v t $ 0 0 0 0 0 0 0 0 - 0 0 0 0 - 0 0 0 0 - 0 0 0 0 - 0 0 0 0 0 0 0 0 0 0 0 0 C H S $ 7 5 b f b 5 7 e - 7 3 4 f - 4 b d a - 8 1 1 e - a 7 5 0 3 2 e d 1 c 6 6 $ 7 5 b f b 5 7 e - 7 3 4 f - 4 b d a - 8 1 1 e - a 7 5 0 3 2 e d 1 c 6 6 3 $ 0 0 0 0 0 0 0 0 - 0 0 0 0 - 0 0 0 0 - 0 0 0 0 - 0 0 0 0 0 0 0 0 0 0 0 0

W o r k s h a r i n g : N o t e n a b l e d

U s e r n a m e :

C e n t r a l M o d e l P a t h :

R e v i t B u i l d : A u t o d e s k R e v i t 2 0 1 7 ( B u i l d : 2 0 1 6 0 2 2 5 _ 1 5 1 5 ( x 6 4 ) )

L a s t S a v e P a t h : E :  R e v i t Km諎 y橆v1 . r v t

O p e n W o r k s e t D e f a u l t : 3

P r o j e c t S p a r k F i l e : 0

C e n t r a l M o d e l I d e n t i t y : 0 0 0 0 0 0 0 0 - 0 0 0 0 - 0 0 0 0 - 0 0 0 0 - 0 0 0 0 0 0 0 0 0 0 0 0

L o c a l e w h e n s a v e d : C H S

A l l L o c a l C h a n g e s S a v e d T o C e n t r a l : 0

C e n t r a l m o d e l ' s v e r s i o n n u m b e r c o r r e s p o n d i n g t o t h e l a s t r e l o a d l a t e s t : 3

C e n t r a l m o d e l ' s e p i s o d e G U I D c o r r e s p o n d i n g t o t h e l a s t r e l o a d l a t e s t : 7 5 b f b 5 7 e - 7 3 4 f - 4 b d a - 8 1 1 e - a 7 5 0 3 2 e d 1 c 6 6

U n i q u e D o c u m e n t G U I D : 7 5 b f b 5 7 e - 7 3 4 f - 4 b d a - 8 1 1 e - a 7 5 0 3 2 e d 1 c 6 6

U n i q u e D o c u m e n t I n c r e m e n t s : 3

M o d e l I d e n t i t y : 0 0 0 0 0 0 0 0 - 0 0 0 0 - 0 0 0 0 - 0 0 0 0 - 0 0 0 0 0 0 0 0 0 0 0 0

 

  

其实这些信息,我在.rvt流文件解析时也看到过,当时找到的东西没有像现在这么精准,也没找到能精准的定位到这些信息位置的方法,所以才一直觉得方法1的思路不是太好。现在通过“解压”获取到了准确的文件信息,这让我感觉踏实了很多。

接下来一步就是,要把.rvt文件进行解析。这个过程,我踩了一个坑,就是按解压的思路去处理这个文件,尝试了很久,竟没有找到解决办法。后来发现.rvt文件流最开始开始八个字节,和老版本的doc,xls,msi等文件相同,所以,我换了一种思路,看看有没解析这些文件的方法,后来真让我找到了。这种文件格式叫做MCDF(Microsoft Compound Document Format files)。并且找到了一个可以操作这种文件的开源类库,通过类库管理工具nuget搜索:OpenMcdf,然后安装即可。

下面给出了一种,这种方式获取.rvt文件版本的实现代码:

 1 private const string BasicFileInfo = "BasicFileInfo";
 2 private const string MatchVersion = @"(?<=Autodesk Revit )20d{2}";
 3 /// <summary>
 4 /// 获取revit文件版本号
 5 /// </summary>
 6 /// <param name="filePath"></param>
 7 /// <returns></returns>
 8 public static string GetVersion(string filePath)
 9 {
10 string version = string.Empty;
11 var fs = new FileStream(filePath,FileMode.Open, FileAccess.Read);
12 var cf = new CompoundFile(fs);
13 var items = cf.GetAllNamedEntries(BasicFileInfo);
14 var useItem = items.FirstOrDefault();
15 if (useItem != null&& useItem.IsStream)
16 {
17 
18 CFStream targetStream = useItem as CFStream;
19 var bytes=targetStream.GetData();
20 var result = Encoding.BieEndianUniCode.GetString(bytes);
21 Regex regex = new Regex(MatchVersion);
22 var match = regex.Match(result);
23 if (match.Success)
24 {
25 version = match.ToString();
26 }
27 }
28 return version;
29 }

revit 2019 的BasicFileInfo格式发生变化,但我们仍然可以发现里面的版本信息【F o r m a t :   2 0 1 9 】,相应的我们把匹配字符串,换成能匹配这个字符串的形式就可以了。

转载自 Revit文件版本判定(不打开Revit方式)_小红楼-CSDN博客

修改了打开BasicFileInfo流的编码,从Unicode改为BigEndianUnicode,实际使用的话需要直接读取流和解压缩两种方法同时使用才行,解压缩的方法应该是适用于2018以上的版本,2018及以下版本的rvt文件需要读文件流

原文地址:https://www.cnblogs.com/LagoOrLY/p/15128322.html