Вопрос или проблема
Я создал несколько больших сеток с помощью Gmsh через Python API. ASCII файлы могут занимать гигабайты. Поскольку бинарные файлы меньше по размеру и быстрее считываются, я настроил Gmsh на сохранение файлов сетки в бинарном формате. Моя текущая проблема – разобраться, как считать эту бинарную сетку обратно в Python в интерпретируемом формате.
Какое бинарное кодирование использует Gmsh для сохраненных файлов и как их можно считать обратно в Python в интерпретируемом виде.
Вот упрощенная версия кода из учебника Gmsh 1 (ссылка), модифицированная для сохранения сетки в бинарном формате.
import gmsh
import sys
gmsh.initialize(argv=["","-bin"])
gmsh.model.add("t1")
lc = 1e-2
gmsh.model.geo.addPoint(0, 0, 0, lc, 1)
gmsh.model.geo.addPoint(.1, 0, 0, lc, 2)
gmsh.model.geo.addPoint(.1, .3, 0, lc, 3)
p4 = gmsh.model.geo.addPoint(0, .3, 0, lc)
gmsh.model.geo.addLine(1, 2, 1)
gmsh.model.geo.addLine(3, 2, 2)
gmsh.model.geo.addLine(3, p4, 3)
gmsh.model.geo.addLine(4, 1, p4)
gmsh.model.geo.addCurveLoop([4, 1, -2, 3], 1)
gmsh.model.geo.addPlaneSurface([1], 1)
gmsh.model.geo.synchronize()
gmsh.model.addPhysicalGroup(1, [1, 2, 4], 5)
gmsh.model.addPhysicalGroup(2, [1], name="My surface")
gmsh.model.mesh.generate(2)
gmsh.write("t1_binary.msh")
gmsh.finalize()
Мой изначальный наивный подход заключался в том, чтобы считать файл в бинарном формате и попробовать .decode()
, но этот подход не срабатывает, когда он проходит строку $Entities
.
mesh_file = []
with open("t1_binary.msh", "rb") as f:
for line in f.readlines():
print(line)
mesh_file.append(line.decode())
Когда он не срабатывает, я получаю ошибку UnicodeDecodeError: 'utf-8' codec can't decode byte 0x9a in position 72: invalid start byte
.
Ответ или решение
Вопрос о том, какой бинарный формат использует GMSH для экспорта сеток и как можно конвертировать их в ASCII, имеет несколько аспектов, которые необходимо рассмотреть.
Бинарный формат GMSH
GMSH использует собственный бинарный формат, называемый GMSH Binary Format, для сохранения файлов сеток. Этот формат более компактен и позволяет быстрее загружать данные в память по сравнению с текстовым (ASCII) форматом, особенно при работе с большими сетками. Бинарный формат представляет данные в виде последовательности байтов, что делает их трудночитаемыми без специальной обработки.
Чтение бинарного файла в Python
Для работы с бинарными файлами GMSH в Python, необходимо использовать библиотеку GMSH или другие подходы, так как напрямую читать и интерпретировать бинарный формат с помощью стандартных методов не получится, как это показали ваши попытки (например, использование .decode()
).
Конвертация бинарного формата в ASCII
Чтобы конвертировать бинарный файл в ASCII, вы можете воспользоваться функциональностью GMSH для экспорта. Это можно сделать, выполнив команду в GMSH или используя API. Вот пример, как это можно сделать в вашем случае:
- Сначала загрузите бинарный файл с помощью GMSH API.
- Затем используйте метод
gmsh.write()
для сохранения сетки в формате ASCII.
Вот пример того, как это можно реализовать в вашем коде:
import gmsh
# Инициализация GMSH
gmsh.initialize()
# Загрузка бинарного файла
gmsh.open("t1_binary.msh")
# Сохранение в ASCII формате
gmsh.write("t1_ascii.msh")
# Завершение работы с GMSH
gmsh.finalize()
Вывод
Таким образом, для работы с сетками и их конвертации между бинарным и ASCII форматами в GMSH, важно использовать встроенные функции и методы API GMSH. Ваша проблема с чтением бинарного файла напрямую связана с тем, что формат байтов не предназначен для текстового чтения без предварительной обработки. Воспользуйтесь API GMSH, чтобы выполнять конвертацию и получить необходимые данные в интерпретируемом формате.