python生成textgrid文件

textgrid文件说明

第一行是固定的:File type = "ooTextFile"
第二行也是固定的:Object class = "TextGrid"
空一行
xmin = xxxx.xxxx  # 表示开始时间
xmax = xxxx.xxxx  # 表示结束时间
tiers? <exists>  # 这一行固定
size = 4     # 表示这个文件有几个item, item也叫tiers, 可以翻译为'层', 这个值是几,就表示有几个item
item []:
    item [1]:
        class = "IntervalTier"
        name = "phone"
        xmin = 1358.8925
        xmax = 1422.5525
        intervals: size = 104
        intervals [1]:
            xmin = 1358.8925
            xmax = 1361.8925
            text = "sil"
        intervals [2]:
            xmin = 1361.8925
            xmax = 1362.0125
            text = "R"
        intervals [3]:
            ...
        intervals [104]:
            xmin = 1422.2325
            xmax = 1422.5525
            text = "sil"
    item [2]:
        class = "IntervalTier"
        name = "word"
        xmin = 1358.8925
        xmax = 1422.5525
        intervals: size = 3
        intervals [1]:
            xmin = 1358.8925
            xmax = 1361.8925
            text = "sp"

textgrid文件中的size的值是几就表示有几个item, 每个item下面包含class, name, xmin, xmax, intervals的键值对,
item中的size是几就表示这个item中有几个intervals, 每个intervals有xmin, xmax, text三个键值参数.
所有item中的xmax-xmin的值是一样的

代码生成

#! /usr/bin/env python
# -*- coding: utf-8 -*-#

# -------------------------------------------------------------------------------
# Name:         demo
# Author:       yunhgu
# Date:         2021/8/24 10:56
# Description: 
# -------------------------------------------------------------------------------
import textgrid

# 读取音频文件给定最大时长
tg = textgrid.TextGrid(minTime=0, maxTime=2)
print(tg.__dict__)

tier_word = textgrid.IntervalTier(name="word", minTime=0., maxTime=2)  # 添加一层,命名为word层
tier_phone = textgrid.IntervalTier(name="phone", minTime=0., maxTime=2)  # 添加一层,命名为phone音素层

# 添加分割线
interval = textgrid.Interval(minTime=0, maxTime=2, mark="s")
interval2 = textgrid.Interval(minTime=1, maxTime=2, mark="asdfas")
tier_word.addInterval(interval)
tier_phone.addInterval(interval2)

# 添加到tg对象中
tg.tiers.append(tier_word)
tg.tiers.append(tier_phone)

print(tg.__dict__)
# 写入保存
tg.write("1.TextGrid")

生成图片样例
image

问题

一般意义上textgrid时间上是不可以有重叠部分的,textgrid,设置了严格性参数,默认为True.
image
因此如果允许时间上有重叠的话,可以:

tier_text = textgrid.IntervalTier(name="文本", minTime=min_time, maxTime=max_time)
tier_text.strict = False
不论你在什么时候开始,重要的是开始之后就不要停止。 不论你在什么时候结束,重要的是结束之后就不要悔恨。
原文地址:https://www.cnblogs.com/yunhgu/p/15179565.html