- Стабильная нестабильность — оксюморон или необходимость?
- Краткое вступление
- Стабильно нестабильное или устойчиво нестабильное состояние системы
- Какие причины могут повлиять на стабильную работу процессора и чем это черевато 🙂
- Если компьютер стал работать нестабильно и с ошибками
- 1. Новая инсталляция
- 2. Вирусы
- 3. Чистим автозагрузку
- 4. Оптимизируем реестр
- 5. Прожорливый софт
- 6. Пыль и контакты
- 7. Проверяем на стресс и температуру
- 8. Ищем конфликты
- 9. Место есть?
- 10. Ошибки есть?
Стабильная нестабильность — оксюморон или необходимость?
Вы скажете — оксюморон! Позволю себе привести некоторые аргументы в защиту данного выражения.
Краткое вступление
Я часто занимаюсь поиском неисправностей в IT системах сложности от средней и выше. Ещё это иногда называют troubleshooting. Хотя иногда переходят на личности и даже обзывают бездельником. Перегрузи хост и дело сделано, говорят мне некоторые коллеги. Я поначалу удивлялся, как можно такое предложить, если на хосте крутится куча сервисов, иногда критических, если куча разработчиков родила массу процессов и хост является частью большой системы!? Потом перестал. И вот почему.
No Reboot
В IT сфере бушует индустриализация. Ничего плохого в этом нет и даже иногда это оправдано. Разделение труда, планирование и т.п. — отлично. Проблема в том, что индустриальная эпоха спровоцировала появление в IT большого количества узких специалистов, которые не имеют широгоко взгляда на задачу/систему, которую они разрабатывают или обслуживают. Они в этом не виноваты и обличать никого не собираюсь, все усилия направлены на поиск причины и решения проблемы. Я убеждён, что специалис должен иметь «широкий взгляд на мир» и на ряду с основной специализацией хотябы поверхносто понимать соседние области. Я называю таких allrounder или «мультинструменталистами» (муз. — играющими на разных инструменах)
Но давайте перейдём от макроэкономики и психологии к технике и я попытаюсь обосновать, почему не стоит просто ребутить сервера. Примем как аксиому, что система изначально работала хорошо и выполняла свои функции. Т.е. была в стабильном состоянии. Тут стоит уточнить и определить как минимум 3 возможных состояния системы:
стабильное (всё работает как надо)
метастабильное (работает, но по принципу «never touch a running system«)
нестабильное (всё плохо)
Нормально работающие системы находятся либо в стабильном, либо на худой конец (и чаще всего) в метастабильном состояниях.
Продолжим. Потом что-то произошло и система перешла в нестабильное состояние. На этой стадии, обычно уже после пары-тройки ребутов, к вам приходят и просят посмотреть, что-ж там всё-таки не работает.
Здесь я введу ещё два важных термина. Состояния системы, как подмножество нестабильного:
стабильно нестабильное (или устойчиво нестабильное)
нестабильно нестабильное
Стабильно нестабильное или устойчиво нестабильное состояние системы
Самый важный момент. Мы точно знаем, что система работает не так, как надо, но не знаем почему. В этом состоянии у нас есть возможность посмотреть логи, поговорить с «людьми» (разрабами, прорабами, сетевиками и пользователями), накопить наблюдения для дальнейших суждений и выводов. Главное — не дестабилизировать стабильно нестабильную систему! Это мой слоган на данном этапе. Самый основной и любимый способ дестабилизации или другими словами, перевода системы в нестабильно нестабильное состояние — ребут.
Простой пример из жизни. Система работала со сбоями. После многочисленных ребутов проблема пропадала и мне ставили на вид, мол помогает, а ты нам тут сказки рассказываешь. Правда заодно появлялись странные артефакты в виде подвисания клиентских сессий и пропадания данных (иногда). Проблема спорадически появлялась снова с снова в самый неприятный момент, обычно на выходных. Оказалось, что накосячили с ротацией логов и диск переполнялся. При ребуте временный раздел освобождался и всё какое-то время как-то работало. Пока он снова не переполнялся. Мониторить этот раздел конечно забыли. Элементарно подправили алгоритм ротации логов. За 5 минут где-то. Есть масса более сложных случаев в больших системах с кучей серверов и сервисов, но не буду засорять эфир, смысл думаю понятен.
Нужно чётко понимать основную цель troubleshooting — определить источник вывода системы из равновесия и вернуть её в стабильное состояние. Часто же просходит неверная интерпретация. Многие боятся признаться в ошибке, а иногда даже пытаются её скрыть. Тут нужно добавить, что ответственные за систему тоже иногда пытаются найти или даже назначить виноватого. Это всё сильно вредит общему делу. Выходит, что без психологии в поиске неисправностей никак не обойтись. Что подтвержнает мой тезис о «мультиниструменталистах» во вступлении.
Подведём итоги. Для успехов в поиске и устранении неисправностей надо:
быть смелым и признаваться в своих ошибках. Это 50% успеха на пути к цели
удерживать нестабильную систему в стабильно нестабильном состоянии
Всё, как в жизни 🙂
Я «по верхам» (high level) пробежал по теории поиска неисправностей и высветил только её один аспект. Если будет интерес, могу углубиться в другие. Всем спасибо.
Источник
Какие причины могут повлиять на стабильную работу процессора и чем это черевато 🙂
Здравствуй, дорогой читатель! На этот раз, пойдёт рассказ об основных сбоях в работе процессора и к чему они могут привести. Давайте разбираться. )
Есть множество причин из — за которых ваш камень может начать проявлять нестабильную работу. Давайте рассмотрим эти причины более основательно.
1. Блокировка и перегрев непосредственно перед выключением ПК.
Если случилась блокировка до окончательного сбоя, то вам нужно понять, что с вашим камнем далеко не всё в порядке. Появляется высокая вероятность перегрева, в итоге, это привело к автоматическому отключению системы, чтобы не было разрушения.
Камень обладает своей СО, если с ней что — то не так, то жди перегрев в лучшем случае, а то и вовсе можно потерять своего кремниевого друга. Поэтому, регулярно проверяйте и чистите все вертушки на вашем ПК, хотя бы один раз в год.
Периодически пыль может нарушить нормальную работы системы охлаждения и привести к большим проблемам с перегревом. Внимательно проверяйте ваши вентиляторы в системном блоке, как у систем охлаждения девайсов, так и обычные. Ещё загляните в BIOS, чтобы определить, есть ли у вас возможность снизить его RPM. Данный параметр может оказать влияние на производительность системы.
Нужно понимать, что длительный перегрев камушка может вызвать сбои в его работе, при таких проблемах, лучше всего постараться сбросить температуру или поменять систему охлаждения на более эффективную. Если всё перечисленное не поможет, то имеет смысл обратиться к мастеру.
Наш ПК проводит диагностику всех устройств, проверяет их на работоспособность, такой процесс называется POST. Если, после прохождения тестирования камень не заработает, то процесс загрузки дальше не пойдёт, и материнская плата издаст характерный писк. Сами звуковые сигналы, можно расшифровать через обычный поисковик в браузере.
3. Высокое напряжение или разгон
Камни способны работать на повышенных частотах, но это может привести к большим проблемам. Ускорение процессора будет усиливать нагрузку на девайс, и как следствие — снижение срока службы изделия.
Вы рискуете своим камнем ради высокой вычислительной мощности, но если в вас есть финансы, то лучше посмотреть на более совершенные модели, которые быстрые и не требуют разгона.
4. Скачок напряжения или нестабильное напряжение
Большинство камней надёжны и способны проработать очень долго. Но, если вы располагаетесь в месте, где частые грозовые или нестабильные линии электропередач, то любой скачок напряжения способен погубить ваш камень и в придачу, утащить все остальные компоненты за собой.
По возможности, не подключайте ваш ПК напрямую к розетке. Задействуйте сетевой фильтр для защиты вашего электронного друга от разного рода скачков.
5. Плохая материнская плата
Как известно, материнская плата является основой для процессора, и если на ней выйдет из строя конденсатор, то он способен вызвать отказ у другого девайса. Нужно провести осмотр, и если вам попадётся вздутый конденсатор или утечка, то вероятней всего, из — за этих проблем ваш камень сбоит.
За вашим процессором нужно внимательно следить и вовремя чистить СО, и ещё, я бы посоветовал купить бесперебойник питания, этот девайс будет гарантом безопасности вашего ПК.
Я рассмотрел основные причины сбоя в работе процессора, если я что — то упустил, то буду рад почитать в комментариях ваши варианты.
Есть желание узнать о высоких технологиях, играх и гаджетах? Тогда смотрим на темы:
Источник
Если компьютер стал работать нестабильно и с ошибками
Мы дадим вам 10 советов, которые помогут вам выявить причину нестабильной работы.
1. Новая инсталляция
Вспомните, что вы недавно устанавливали в систему? Может, добавили новую планку памяти либо инсталлировали какую-нибудь программу. Возможно, причина в новой программе.
2. Вирусы
Проверьте систему на наличие вирусов, запустив ваш антивирус на полную проверку системы. Вирусы часто становятся причиной нестабильной работы. Для подстраховки можете проверить компьютер бесплатной утилитой Dr. Web CureIt. Она не требует установки и не конфликтует с вашим антивирусом.
3. Чистим автозагрузку
Посмотрите, нет ли в автозагрузке неизвестных подозрительных процессов (не все вредоносные программы определяются антивирусами). Заодно уберите из автозагрузки те программы, автоматическая загрузка которых вам не нужна.
4. Оптимизируем реестр
Почистите реестр с помощью специальных утилит (например, CCleaner). Только не забудьте сохранить копию реестра перед чисткой.
5. Прожорливый софт
Вызовите диспетчер задач (“Ctrl+Alt+Del”), перейдите во вкладку “Процессы” и посмотрите, нет ли приложений или процессов, потребляющих неоправданно много ресурсов.
6. Пыль и контакты
Откройте корпус, посмотрите, крутятся ли вентиляторы. Если скопилось много пыли, аккуратно избавьтесь от нее.
Вытащите видеокарту, PCI-устройства, планки памяти, почистите контакты ластиком и вставьте обратно. Надеюсь, вы не забыли перед этим выключить компьютер.
7. Проверяем на стресс и температуру
Проверьте систему на стрессоустойчивость с помощью специальных тестов. Для процессоров подойдет бесплатная утилита IntelBurnTest. Работу видеокарты проверьте утилитой 3DMark.
Узнайте температуру вашего процессора и видеокарты. Критические значения для каждого камня свои, но в среднем температура не должна превышать 60-70 градусов по Цельсию. Проверьте память утилитой memtest.
8. Ищем конфликты
Загляните в Диспетчер задач в поисках конфликта аппаратных устройств. О проблемах сигнализируют значки желтого вопроса и красного восклицательного знака.
9. Место есть?
Посмотрите, может на системном диске почти не осталось свободного места. Желательно иметь не меньше 2-3 Гб.
10. Ошибки есть?
Если компьютер периодически перезагружается, можно попробовать узнать причину. Отключите автоматическую перезагрузку: “Настройка > Панель управления > Система > Дополнительно > Загрузка и восстановление > Параметры”. В этом подменю уберите галочку с пункта “Выполнить автоматическую перезагрузку”. Теперь компьютер при возникновении серьезного сбоя покажет “синий экран смерти”. На нем будет указан код ошибки и и его символьное имя (например 0x0000001E, KMODE_EXCEPTION_NOT_HANDLED), четыре параметра, поясняющие ошибку, предназначенные для отладочного ПО. Также система может указать на адрес места ошибки и название драйвера, в котором произошла ошибка. Список кодов и возможные пути решения проблемы можно найти в Интернете.
Источник