Python中尽量少用加号“+”连接字符串的原因

在Python中,String对象是定长对象,一旦创建,长度就不可变化,若是使用+号连接两个字符串,则会新开辟一段长度总和长度的内存,再将两个字符串memcpy进去。如果要连接N个String对象,则要进行N-1次内存申请和拷贝。

string_concat(register PyStringObject *a, register PyObject *bb)
{
register Py_ssize_t size;
register PyStringObject *op;
//................
op = (PyStringObject *)PyObject_MALLOC(PyStringObject_SIZE + size);
if (op == NULL)
return PyErr_NoMemory();
PyObject_INIT_VAR(op, &PyString_Type, size);
op->ob_shash = -1;
op->ob_sstate = SSTATE_NOT_INTERNED;
Py_MEMCPY(op->ob_sval, a->ob_sval, Py_SIZE(a));
Py_MEMCPY(op->ob_sval + Py_SIZE(a), b->ob_sval, Py_SIZE(b));
op->ob_sval[size] = '';
return (PyObject *) op;
#undef b
}

官方推荐的是使用字符串的join方法,该方法对于连接一个list或tuple中的元素非常有效,他会先统计所有元素的长度,申请内存,然后拷贝。

''.join(['a', 'b', 'c']) //better
'a' + 'b' + 'c'
原文地址:https://www.cnblogs.com/yunlongaimeng/p/10838185.html