Как сохранить файл в формате tsv

Обновлено: 04.07.2024

Значения , разделенные табуляцией ( TSV файл) представляет собой простой текстовый формат для хранения данных в табличной структуре, например, таблицы базы данных или табличных данных, и способ обмена информацией между базами данных . Каждая запись в таблице представляет собой одну строку текстового файла . Каждое значение поля записи отделяется от следующего символом табуляции . Формат TSV, таким образом, является типом более общего формата значений, разделенных разделителями .

TSV - это простой формат файла, который широко поддерживается, поэтому он часто используется при обмене данными для перемещения табличных данных между различными компьютерными программами, поддерживающими этот формат. Например, файл TSV может использоваться для передачи информации из программы базы данных в электронную таблицу.

TSV - это альтернатива общему формату значений, разделенных запятыми (CSV), который часто вызывает трудности из-за необходимости экранировать запятые - буквальные запятые очень распространены в текстовых данных, но буквальные табуляции нечасты в бегущем тексте. Стандарт IANA для TSV обеспечивает простоту, просто запрещая вкладки в полях.

СОДЕРЖАНИЕ

Пример

Например, заголовок набора данных цветка ириса может быть сохранен в виде TSV с использованием следующего простого текста (обратите внимание, что при отрисовке HTML табуляции могут быть преобразованы в пробелы):

Приведенный выше простой текст TSV соответствует следующим табличным данным:

Длина чашелистики Ширина чашелистики Длина лепестка Ширина лепестка Разновидность
5.1 3.5 1.4 0,2 I. setosa
4.9 3.0 1.4 0,2 I. setosa
4,7 3,2 1.3 0,2 I. setosa
4.6 3.1 1.5 0,2 I. setosa
5.0 3,6 1.4 0,2 I. setosa

Соглашения о преобразовании без потерь в TSV

Поскольку значения в формате TSV не могут содержать буквальные табуляции или символы новой строки, необходимо соглашение для преобразования текстовых значений с этими символами без потерь. Распространенным соглашением является выполнение следующих экранирований:

Другое распространенное соглашение - использовать соглашение CSV из RFC 4180 и заключать эти специальные символы в двойные кавычки. Это может привести к двусмысленностям.

Другая неоднозначность заключается в том, разделяются ли записи символом новой строки, как это было бы типично для строк в UNIX, или символом возврата каретки, новой строки, как это было бы типично для платформ Microsoft. Многие программы, такие как LibreOffice, ожидают возврата каретки и новой строки.

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Обзор модуля

В этой статье описывается, как использовать модуль Convert to TSV в машинное обучение Azure Studio (классическая модель) для преобразования любого набора данных из внутреннего формата, используемого всеми модулями машинное обучение Azure Studio (классическая модель), в неструктурированный файл в формате с разделителями-табуляторами.

Файлы, разделенные табуляцией, (TSV) совместимы со многими внешними средствами, включая:

Excel и PowerPivot

Все реляционные базы данных

Например, если в эксперименте есть промежуточный набор данных, который вы хотите сохранить для повторного использования в другом инструменте или вызвать из кода, его можно преобразовать в формат TSV, а затем щелкнуть правой кнопкой мыши преобразованный набор данных, чтобы получить код Python, необходимый для доступа к набору данных.

Использование Convert to TSV

Используйте модуль Convert to TSV каждый раз, когда необходимо скачать набор данных в формате с разделителями-символами табуляции.

Добавьте в свой эксперимент преобразуйте преобразование в TSV . Этот модуль можно найти в категории преобразования форматов данных в машинное обучение Azure Studio (классическая модель).

Подключите модуль к другому датсет или к модулю, который выводит табличный набор данных.

Запустите эксперимент или щелкните правой кнопкой мыши только модуль преобразовать в TSV и выберите пункт Выполнить выбранное.

Результаты

После завершения преобразования можно открыть набор данных, вызвать его из кода R или Python, использовать его в записной книжке Jupyter или сохранить в локальном файле.

Если вы хотите загрузить набор данных, дважды щелкните его и укажите, нужно ли открыть или сохранить датсет.

Если выбран вариант Открыть, набор данных загружается с помощью любого инструмента, используемого компьютером по умолчанию для открытия. TSV файлов. Обычно это Microsoft Excel.

При выборе параметра скачать набор данных по умолчанию файл сохраняется с именем модуля и идентификатором GUID, представляющим идентификатор рабочей области. Однако можно выбрать параметр Сохранить как во время загрузки и изменить имя файла или расположение.

Примеры

Перекрестная проверка для примера двоичной классификации: экспортирует результаты перекрестной проверки в формат данных с разделителями-запятыми (CSV), чтобы результаты для нескольких моделей можно было сравнивать с помощью такого средства, как Excel.

Цветовая сжатие изображений на основе цветов дискретизация: экспортирует наборы данных, используемые для каждой части анализа, в CSV-файлы, чтобы можно было легко запустить подобную модель в любом средстве, поддерживающем формат CSV.

Технические примечания

В этом разделе содержатся сведения о реализации, советы и ответы на часто задаваемые вопросы.

Требования к формату TSV

TSV (значения, разделенные табуляцией) — это текстовый формат, используемый для хранения данных в виде таблицы. Это очень похоже на формат CSV, но разделителем является табуляция, а не запятая.

Формат TSV — это полезная альтернатива распространенному формату CSV, если данные содержат запятые. Запятые очень распространены в текстовых данных и используются в европейском числовом формате.

Одна из проблем формата TSV заключается в том, что табуляцию часто считают пустым пространством в неструктурированном тексте. Помимо этого стандарт IANA для TSV способствует чистому и точному синтаксического анализу файлов TSV с помощью запрета на табуляцию внутри полей.

Обратите внимание на следующие требования для TSV-файлов в Машинное обучение Azure Studio (классическая модель):

Модуль Преобразование в TSV поддерживает вывод одной строки заголовка, если набор данных содержит имена столбцов.

Поставщик TSV поддерживает только кодировку символов UTF-8.

При чтении или записи файлов TSV производительность может быть ниже, чем для других форматов (например, CSV).

Текстовые файлы данных являются одним из наиболее распространенных методов хранения данных в современном мире. Это потому, что текстовые файлы, как правило, занимают последнее место и их проще всего хранить. К счастью, в Microsoft Excel очень просто вставить файлы CSV (значения, разделенные запятыми) или TSV (значения, разделенные табуляцией).

Если вы хотите вставить CSV или TSV в лист Excel, вам нужно только точно знать, как разделяются данные в файле. Вам не обязательно знать подробности о данных, если вы не хотите переформатировать эти значения в строки, числа, проценты и многое другое.


В этой статье вы узнаете, как вставить файл CSV или TSV в таблицу Excel и как переформатировать эти данные в процессе импорта, чтобы сэкономить время.

Как вставить файл CSV в лист Excel

Прежде чем вы сможете вставить файл CSV в свой лист Excel, вы должны подтвердить, что файл данных фактически разделен запятыми (также известный как «разделенный запятыми»).

Убедитесь, что это файл, разделенный запятыми

Для этого откройте Window Explorer и перейдите в каталог, где хранится файл. Выберите меню «Вид» и убедитесь, что выбрана панель «Предварительный просмотр».


Затем выберите файл, который, по вашему мнению, содержит данные, разделенные запятыми. Вы должны увидеть запятую между каждым фрагментом данных в текстовом файле.

Приведенный ниже пример взят из правительственного набора данных, содержащего результаты оценки студентов колледжа SAT за 2010 год.


Это пример того, как выглядит файл с разделенными запятыми значениями. Теперь, когда вы подтвердили форматирование ваших исходных данных, вы готовы вставить их в свой лист Excel.

Вставьте файл CSV в свой лист

Чтобы вставить исходный файл данных CSV в свой лист Excel, откройте пустой лист.

  1. Выберите Данные из меню
  2. Выберите «Получить данные» из группы «Получить и преобразовать данные» на ленте.
  3. Выбрать из файла
  4. Выбрать из текста / CSV


Примечание. В качестве альтернативы можно также выбрать «Из текста / CSV» непосредственно на ленте.

Откроется браузер файлов. Найдите, где вы сохранили CSV-файл, выберите его и выберите «Импорт».


Откроется мастер импорта данных. Excel анализирует входящие данные и устанавливает все раскрывающиеся списки в соответствии с форматом файла входных данных на основе первых 200 строк.

Вы можете настроить этот анализ, изменив любой из следующих параметров:

  • Происхождение файла: если файл имеет другой тип данных, такой как ASCII или UNICODE, вы можете изменить это здесь.
  • Разделитель: Если в качестве альтернативного разделителя используются точки с запятой или пробелы, вы можете выбрать их здесь.
  • Обнаружение типа данных: вы можете заставить Excel анализировать на основе всего набора данных, а не только первых 200 строк.

Когда вы будете готовы импортировать данные, выберите Загрузить внизу этого окна. Это принесет весь набор данных в ваш пустой лист Excel.


После того, как у вас есть эти данные на листе Excel, вы можете затем реорганизовать эти данные, сгруппировать строки и столбцы или выполнить функции Excel с данными.

Импорт файла CSV в другие элементы Excel


Параметры в этом окне включают в себя:

  • Таблица: это настройка по умолчанию, которая импортирует данные в пустой или существующий лист
  • Отчет сводной таблицы: внесите данные в отчет сводной таблицы, который позволяет суммировать входящий набор данных
  • Сводная диаграмма: отображение данных в виде сводной диаграммы, например гистограммы или круговой диаграммы
  • Only Create Connection: создает соединение с внешним файлом данных, который можно использовать позже для создания таблиц или отчетов на нескольких листах.

Опция PivotChart очень мощная. Это позволяет вам пропустить этапы сохранения данных в таблице, а затем выбрать поля для создания диаграмм или графиков.

В рамках процесса импорта данных вы можете выбрать поля, фильтры, условные обозначения и данные осей, чтобы создать эту графику за один шаг.


Как видите, при вставке CSV в лист Excel существует большая гибкость.

Как вставить файл TSV в лист Excel

Что если ваш входящий файл будет разделен табуляцией, а не запятыми?

Процесс в основном такой же, как в предыдущем разделе, но вы хотите использовать выпадающий список Разделитель, чтобы выбрать Tab.


Кроме того, помните, что когда вы просматриваете файл данных, Excel автоматически предполагает, что вы ищете файл * .csv. Поэтому в окне браузера файлов не забудьте изменить тип файла на Все файлы (*. *), Чтобы увидеть файл типа * .tsv.

После того, как вы выбрали правильный разделитель, импорт данных в любой лист Excel, сводную диаграмму или сводный отчет работает точно так же.

Как работает преобразование данных

Если в окне «Импорт данных» выбрать «Преобразовать данные» вместо «Загрузить», откроется окно редактора Power Query Editor.

Это окно дает вам представление о том, как Excel автоматически преобразует импортируемые данные. Здесь также можно настроить способ преобразования этих данных во время импорта.

Если вы выберете столбец в этом редакторе, вы увидите предполагаемый тип данных в разделе «Преобразование» на ленте.

В приведенном ниже примере вы можете видеть, что Excel предполагал, что вы хотите преобразовать данные в этом столбце в формат целого числа.


Вы можете изменить это, нажав стрелку вниз рядом с типом данных и выбрав тип данных, который вы предпочитаете.


Вы также можете изменить порядок столбцов в этом редакторе, выбрав столбец и перетащив его в положение, куда вы хотите поместить его на листе.

Если в вашем входящем файле данных нет строки заголовка, вы можете изменить Использовать первую строку в качестве заголовков, чтобы Использовать заголовки в качестве первой строки.

Обычно вам никогда не нужно использовать Power Query Editor, так как Excel довольно хорошо анализирует входящие файлы данных.

Однако, если эти файлы данных несовместимы в том, как они форматируются, или вы хотите реорганизовать способ отображения данных на вашем листе, тогда Power Query Editor позволяет вам это сделать.

Ваши данные в базе данных MySQL? Узнайте, как подключить Excel к MySQL для ввода этих данных. Если ваши данные уже находятся в другом файле Excel, существуют также способы объединения данных из нескольких файлов Excel в один файл.

В этом посте мы покажем вам, как открывать и просматривать экспортированные файлы .TSV на ПК с Windows 10 с помощью Excel. Вы также можете использовать бесплатное программное обеспечение для просмотра файлов TSV или онлайн-инструменты. TSV или файлы значений, разделенные табуляцией, содержат текстовые данные, которые можно преобразовать в формат электронной таблицы. Файл значений, разделенных табуляцией, представляет собой простой текстовый формат для хранения данных в табличной структуре.

Открывать файлы TSV на ПК с Windows 10

Следуйте подробной процедуре, чтобы извлечь данные из файла .TSV:

1]Щелкните ячейку, из которой вы хотите вставить данные. Для простоты объяснения я выбрал ячейку A1.

2]Перейдите к Данные вкладка и в Получение и преобразование данных раздел, выберите Из текста / CSV.

Как открыть файлы TSV

3]Просмотрите файл .TSV и откройте его. Обратите внимание, что вам нужно будет выбрать опцию из раскрывающегося меню «Все файлы», поскольку формат .TSV не входит в число обычных опций.


5]Проверьте отображаемые данные и после проверки формата выберите Нагрузка.


6]В следующем окне выберите опцию «Закрыть и загрузить».

Как открыть файлы TSV на ПК с Windows 10

7]Данные будут воспроизведены на листе Excel в виде таблиц.


Так было с Microsoft Excel, однако вы также можете просматривать эти данные с помощью других программ просмотра файлов TSV.

Бесплатное программное обеспечение для просмотра файлов TSV и онлайн-инструменты

Начнем с того, что файлы .TSV можно просматривать во всех текстовых редакторах, таких как Блокнот, Wordpad и Microsoft Word. Однако проблема в том, что они не организуют данные в электронной таблице или табличном формате. Весь смысл создания файла .TSV состоит в том, чтобы убедиться, что данные находятся в формате .TSV. Вот еще несколько бесплатных приложений, которые могут вам помочь:

  1. Apache OpenOffice
  2. LibreOffice
  3. Microsoft Excel онлайн
  4. Таблицы Google.

1]Apache OpenOffice

2]LibreOffice

3]Microsoft Excel Online

4]Google Таблицы

Пожалуйста, дайте нам знать, если у вас есть какие-либо дополнительные предложения в разделе комментариев.

Читайте также: